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(57) Abstract 



The present invention relates to any DNA sequence comprising as a coding region all or part of the nucleotidic sequence coding for a 
mRNA coding coding for a cinnamoyl CoA reductase (CCR) in lucem and/or corn, or all or part of the nucleotide sequence complementary 
of the latter and coding for an antisense mRNA susceptible of hybridizing with said mRNA. The invention also relates to the use of said 
sequences for implementing processes for the regulation of lignin biosynthesis in plants. 



(57) Abrege* 

La prtfsente invention concerne toute sequence d* ADN comprenant a titre de region codante, tout ou partie de la sequence nucldotidique 
codant pour un ARNm codant pour une cinnamoyl CoA reductase (CCR) chez la tuzeme et/ou le mai's, ou tout ou partie de la sequence 
nucleotidique compllmentaire de ces demieres et codant pour un ARNm antisens susceptible de s'hybrider avec I'ARNm susmentionntf. 
L' invention vise 6galement I' utilisation des sequences susmentionne'es pour la mise en oeuvre de proc£d£s de regulation de la biosynthese 
de lignines chez les plantes. 
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SEQUENCES D'ADN CODANT POUR UNE CINNAMOYL CoA 
REDUCTASE, ET LEURS APPLICATIONS DANS LE DOMAINE DE 
LA REGULATION DES TENEURS EN LIGNINES DES PL ANTES. 



La presente invention a pour objet 1' utilisation de sequences d'ADN 
codant pour une cinnamoyl CoA reductase (CCR) chez les plantes. ou de tout 
fragment de ces sequences, ou encore de toute sequence derivee de ces 
dernieres, ou de leurs sequences complementaires. dans le cadre de la mise en 
oeuvre de procedes de regulation du taux de lignine chez les plantes. 

La lignine est un polymere aromatique heterogene complexe qui 
impermeabilise et renforce les parois de certaines cellules des plantes. 

La lignine est formee par polymerisation de radicaux libres derivant de 
monolignols tels que les alcools paracoumarylique, coniferylique et 
sinapylique (Higuchi, 1985, in Biosynthesis and degradation of wood 
components (T. Higuchi, ed), Academic Press, Orlando, FL, pp. 141-160). 

Les lignines presentent une grande variation dans leur contenu relatif en 
monolignols, en fonction des especes, et des differents tissus au sein d'une 
meme plante. 

Cette variation est probablement due et controlee par les differentes 
activites et specificites de substrats, des enzymes necessaires a la biosynthese 
des monomeres de la lignine (Higuchi, 1985, susmentionne). 

Au-dela de son role dans la structure et le developpement des plantes, la 
lignine represente un composant majeur de la biomasse terrestre et revet une 
grande importance economique et ecologique (Brown, 1985, J. Appl. 
Biochem. 7, 371-387; Whetten and Sederoff, 1991, Forest Ecology and 
Management, 43, 301-316). 

Sur le plan de l'exploitation de la biomasse, il convient tout d'abord de 
noter que la lignine est un facteur limitant de la digestibilite et du rendement 
nutritionnel des plantes fourrageres. En effet, il est clairement demontre que la 
digestibilite des plantes fourrageres par les ruminants, est inversement 
proportionnelle a la teneur en lignines de ces plantes, la nature des lignines 
etant egalement un facteur determinant dans ce phenomene (Buxton and 
Roussel, 1988, Crop. Sci., 28, 553-558; Jung and Vogel, 1986, J. Anim., 
Sci., 62, 1703-1712). 

Parmi les principales plantes fourrageres chez lesquelles il serait 
interessant de diminuer les teneurs en lignines, on peut citer: Iuzerne, fetuque, 
mais, fourrage utilise en ensilage... 
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Notons egalement que des teneurs en hgnmes elevees sont en partie 
responsab.es de ,a qua.ite .im.tee des tourteaux de tournesol destmes a 
I ahmentation du betail, et de la diminution des capacites germinauves de 
certaines semences dans le domaine de 1' horticulture 

On peut sou.igner egalement que la hgnification mtense qui se produit 
lors de la conservation des crganes vegetaux apres reco.te, rend rapidement 
■mpropres a la consommation. des productions te.les que 1'asperge. .iename 
les carottes, etc... s 

Par ailleurs, il convient de noter egalement que plus de 50 millions de 
tonnes de lignines sont extraites de la matiere ligneuse chaque anr.ee dans le 
cadre de la production de la pate a papier dans Industrie papetiere Cette 
operation detraction necessaire a Intention de la cellulose est 
energeuquement couteuse et secondairement polluante a travers les composes 
cheques mis en jeu pour .'extraction et que Ion retrouve dans 
environnement (Dean and Eriksson. 1992. Holzforschung 46 135-147 
Whetten and Sederoff, 1991. susmentionne). 

Reduire les proportions en lignines (qui selon les especes, represent, 
de 20 a 30% de la matiere seche) de quelques pour cents (2 a 5%) 
representee* un gain de rendement. une economie substantielle (produus 
ch imi ques) et contribuerait a Amelioration de I'environnement (reduction des 
pollunons). Etant donne les echelles d'utilisation de la matiere ligneuse Ces 
retombees auraiem des repercussions extremement importantes. Dans 
les especes concernees pourraient etre le peupher. reucalyptus. V Acacia 
mangium, le genre Casuarina et 1 'ensemble des ang.ospermes et 
gymnospermes utilises pour la production de pate a papier. 

II est clair que, dans les deux domaines considers, la reduction des taux 
de hgmnes doit etre moderee pour conserver a la plante (ou a 1'arbre) ses 
caracteristiques de rigidite et son architecture normale pu.sque les Ugrunes qui 
consolident les parois ce.lulaires jouent un role important dans le maintien du 
port dresse des vegetaux. 

Les variations naturelles dans les teneurs en Hgmnes observees dans la 
nature pour une meme espece (ecarts pouvant aller jusqu'a 6-8% de la masse 
seche entre individus) autorisent les diminutions evoquees plus haut 

La resistance a la degradation de la lignine, de meme que les difflcultes 
que Ton rencontre dans le cadre de son extraction, sont probablemen, dues a la 
structure comp.exe de ce polymere constitue de liaisons ether et carbone- 
carbone entre les monomeres, atnsi qu'aux nombreuses liaisons chtmiques 
existam entre la lignine et d autres composants de la paroi cellulaire (Sarkanen 
and Ludwig, 1971, in Lignins: Occurrence, Formation, Structure and 
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Reactions (K.V. Sarkanen and C.H. Kudwig eds) New York: Wiley - 
Interscience, pp. 1-18). 

Partant des cinnamoyls-CoA, la biosynthese des lignines chez les 
plantes, est effectuee de la maniere suivante: 
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Une approche, par voie de genie genetique, pour center de reduire le 
taux de hgnmes chez les plantes. consistent a mhiber la synthese d'une des 
enzymes de la chaine de la biosynthese de ces hgnines md.quees c-dessus 

Une technique particulierement appropriee dans le cadre d'une telle 
approche. est celle de .'uti.isat.on d'ARNm antisens susceptible de s'hybnder 
avec I'ARNm codant pour ces enzymes, et par consequent, d'empecher pour 
le moms partiellement. la production de ces enzymes a partir de .eur ARNm 
correspondant. 

Un telle strategie antisens. realisee a 1'aide du gene codant pour la CAD 
chez le tabac. a fait I'objet de la demande de brevet europeen n° 584 117 
decnvant I 'utilisation d'ARNm antisens susceptible dinh.ber la production de 
hgnmes chez les plantes en s'hybridant a I'ARNm codant pour la CAD chez 

ces plantes. 

Les resultats au n.veau des plantes ainsi transformees demontrent une 
reduct.on de lactivite de la CAD. mais paradoxalemem, les teneurs en 
l.gn.nes ne montrent pas d evolution. Des etudes como.ementatres indiquent 
que les Iignines de plantes transformees sont d.fferentes des ligntnes temoms 
car les aldehydes cinnamyliques sont directement incorpores dans le polymere 
lignine. 

L'un des buts de la presente invention est precisement celu, de fournir 
un procede permettant de regu.er efficacemem les teneurs en Hgn.nes dans les 
plantes. soit dans le sens d'une diminution sensible de ces teneurs par rapport 
aux teneurs normales dans les plantes, soit dans le sens d'une augmentat.on de 

ces teneurs. ■ * " 

Un autre but de la presente mvention est de fournir les outils pour la 
m,se en oeuvre d'un tel procede. et plus particu.ierement des constructions 
utilisables pour la transformation de plantes. 

Un autre but de la presente invention est de fournir des plantes 
transformees genetiquement; notamment des plantes fourrageres susceptibles 
d etre rmeux digerees que les plantes non transformees, ou encore des plantes 
ou arbres transformes pour la producuon de la pate a pap.er, et dont 
I extraction des Iignines serait facilitee et mcins polluante que dans le cas 
d arbres non transformes. 

Un autre but de la presente invention est celui de fournir des p.antes 
transformees davamage resistantes a des attaques de 1 'environnement 
notamment a des attaques parasita.res, que ne le sont les plantes non 
transformees, ou encore des plantes transformees de plus erande taille ou de 
ta.lle plus reduite (que celle des plantes non transformees) 
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La presente invention a pour objet ('utilisation de sequences 
nucleotidiques recombinantes contenant une (ou plusieurs) region(s) 
codante(s). cette (ces) region(s) codante(s) etant constituee(s) dune sequence 
nucleotidique choisie parmi les suivantes: 

- la sequence nucleotidique representee par SEQ ID NO 1. codant pour 
un ARNm, cet ARNm codant lui-meme pour la cinnamoyl CoA reductase 
(CCR) de luzerne representee par SEQ ID NO 2, 

- la sequence nucleotidique representee par SEQ ID NO 3. codant pour 
un ARNm, eel ARNm codant lui-meme pour la CCR de mais representee par 
SEQ ID NO 4, 

- un fragment de la sequence nucleotidique representee par 
SEQ ID NO 1, ou de celle representee par SEQ ID NO 3, ce fragment codant 
pour un fragment de la CCR representee par SEQ ID NO 2 ou pour un 
fragment de la CCR representee par SEQ ID NO 3, respectivement, ce 
fragment de CCR presentant une activite enzymatique equivalente a celle des 
deux CCR susmentionnees, 

- la sequence nucleotidique complementaire de celle representee par 
SEQ ID NO 1 ou SEQ ID NO 3. cette sequence complementaire codant pour 
un ARNm antisens susceptible de s'hybrider avec lARNm code par les 
sequences SEQ ID NO 1 et SEQ ID NO 3, respectivement, 

- un fragment de la sequence nucleotidique complementaire de celle ' 
representee par SEQ ID NO 1 ou SEQ ID NO 3, ce fragment de sequence 
codant pour un ARNm antisens susceptible de s'hybrider avec I' ARNm codant 
lui-meme pour la CCR representee par SEQ ID NO 2, ou avec l'ARNm 
codant lui-meme pour la CCR representee par SEQ ID NO 4, respectivement, 

- la sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 1 ou SEQ ID NO 3, notamment par mutation et/ou addition, et/ou 
suppression, et/ou substitution d'un ou plusieurs nucleotides, cette sequence 
derivee codant soit pour un ARNm codant lui-meme pour la CCR representee 
par SEQ ID NO 2 ou SEQ ID NO 4 respectivement, ou pour un fragment ou 
une proteine derivee de ces dernieres, ce fragment ou proteine derivee 
presentant une activite enzymatique equivalente a celle desdites CCR chez les 
plantes, 

- la sequence nucleotidique derivee de la sequence nucleotidique 
complementaire susmentionnee, ou du fragment de cette sequence 
complementaire tel que decrit ci-dessus, par mutation et/ou addition, et/ou 
suppression, et/ou substitution d'un ou plusieurs nucleotides, cette sequence 
derivee codant pour un ARNm antisens susceptible de s'hybrider avec un des 
ARNm susmentionnes. 
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pour la transformation de cellules vegetales en vue de I'obtention de plantes 
transgemques au sein desquelles la biosynthese des lignines est regulee soit 
dans le sens d'une augmentation, soit dans Ie sens d'une diminution des 
teneurs en hgnines produites, par rapport aux teneurs normales en lignines 
produites chez . les plantes, et/ou dans le sens d une modification de la 
composition des lignines produites par lesdites plantes transeeniques par 
rapport aux hgnines produites chez les plantes non transformer, notamment 
par rn.se en oeuvre d'un des procedes, decrits ci-apres, de regulation de la 
quantite de lignine chez les plantes. 

Par "sequence nucleotidique derivee". dans ce qui precede et ce qui suit 
on entend toute sequence presentant au moins environ 50% (de preference au 
moins 70%) de nucleotides homologues a ceux de la sequence dont elle der.ve 

Par "proteine derivee" dans ce qui precede et ce qui suit, on entend toute 
proteine presentant au moins environ 50% (de preference au moins 70%) 
d acides amines homologues a ceux de la proteine dont elle derive. 

La presente invention a plus particulierement pour objet toute sequence 
d'ADN, caracterisee en ce qu'elle comprend a litre de region codante: 

- la sequence nucleotidique representee par SEQ ID NO 1, codant pour 
un ARNm, cet ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 2, ou 

- un fragment de la sequence nucleotidique susmemionnee, ce fragment 
codant pour un fragment de la CCR representee par SEQ ID NO 2, ce 
fragment de CCR presentant une activite enzymatique equivalente a celle de la 
CCR susmemionnee, ou 

- toute sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 1 susmemionnee, ou d un fragment tel que decrit ci-dessus de 
cette sequence, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm codant lui-meme pour la CCR representee par SEQ ID NO 2 
ou pour une proteine derivee de cette derniere et presentant une activite 
enzymatique equivalente a celle de ladite CCR chez les plantes. 

La presente invention a plus particulierement pour objet toute sequence 
d'ADN, caracterisee en ce qu'elle comprend a titre de region codante: 

- la sequence nucleotidique representee par SEQ ID NO 3, codant pour 
ARNm, cet ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 4, ou 

- un fragment de la sequence nucleotidique susmentionnee. ce fragment 
codant pour un fragment de la CCR representee par SEQ ID NO 4, ce 
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fragment de CCR presentant une activite enzymatique equivalente a celle de la 
CCR susmentionnee, ou 

- toute sequence nucieotidique derivee de la sequence representee par 
SEQ ID NO 3, susmentionnee, ou d'un fragment tel que decrit ci-dessus de 
5 cette sequence, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm codant lui-meme pour la CCR representee par SEQ ID NO 4, 
ou pour une proteine derivee de cette derniere et presentant une activite 
enzymatique equivalente a celle de ladite CCR chez les plantes. 

10 Par proteine presentant une activite enzymatique equivalente a celle des 

CCR presentes chez les plantes, et plus particulierement des CCR representees 
par SEQ ID NO 2 et SEQ ID NO 4, on emend toute proteine possedant une 
activite CCR telle que mesuree selon la methode de Luderitz et Grisebach 
publiee dans Eur. J. Biochem. (1981), 119: 115-127. 

15 A litre d* illustration, cette methode est realisee par mesure 

spectrophotometrique de I 'activite reductrice de la proteine (CCR ou derivee), 
en suivant la disparition des cinnamoyl CoA a 366 nm. La reaction se deroule 
a 30°C, pendant 2 a 10 minutes. La composition du milieu reactionnel est la 
suivante: tampon phosphate 100 mM, pH 6.25, 0,1 mM NADPH, 70 /jlM 

20 Feruloyl CoA, 5 a 100 d'extrait enzymatique dans un volume total de 
500 M l. 

L* invention a egalement pour objet toute sequence d'ADN, caracterisee 
en ce qu'elle comprend a titre de region codante: 

- la sequence nucieotidique complementaire de celle representee par 
25 SEQ ID NO 1, cette sequence complementaire codant pour un ARNm antisens 

susceptible de s'hybrider avec ['ARNm codant lui-meme pour la CCR 
representee par SEQ ID NO 2, a savoir l'ARNm code par la sequence 
representee par SEQ ID NO 1, ou code par une sequence derivee de cette 
derniere, telle que definie ci-dessus, ou 
30 " un fragment de la sequence complementaire susmentionnee, ce 

fragment de sequence codant pour un ARNm antisens susceptible de 
s'hybrider avec TARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 2, tel que defini ci-dessus, ou 

- toute sequence nucieotidique derivee de la sequence complementaire 
35 susmentionnee, ou du fragment de cette sequence complementaire tel que 

decrit ci-dessus, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution dun ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm antisens susceptible de s'hybrider avec l'ARNm susmentionne. 
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La presente invention a plus paniculierement pour objet toute sequence 
d ADN. caracterisee en ce qu'elle coraprend a titre de re eion codante- 
,POrn h ^T enCe nUC " 0tidiClUe complementaire de celle representee par 
lD N ° 3 " C£tte S ' quence complementaire co dan, pour un ARNm antisens 
suscept.b.e de s'hybrider avec l'ARNm codant lui-meme pour la CCR 
representee pan SEQ ID NO 4. a savoir l'ARNm code par .a sequence 
representee par SEQ ID NO 3. ou code par une sequence derivee de cette 
derniere. telle que definie ci-dessus, ou 

- un fragment de la sequence complementaire susmentionnee ce 
fragment de sequence codant pour un ARNm antisens susceptible de 

Ltf; n aVeC rARNm C ° dam ,U ™ e P™. '« CCR representee par 
SEQ ID NO 4. tel que defini ci-dessus, ou 

- toute sequence nucleotidique derivee de la sequence complements 
susmentionnee, ou du fragment de cette sequence complementaire «e. que 
deem c-dessus. notamment par mutation et/ou addition, et/ou suppression 
et/ou substitute d'un ou plusieurs nucleotides, cette sequence derivee codam 
pour un ARNm antisens susceptible de s'hybrider avec l'ARNm susmentionne 

II va de soi que les sequences representees par SEQ ID NO 1 et SEQ ID 
NO 3. les sequences complementaires, les sequences derivees et les fragments 
de sequences de 1' invention mentionnees ci-dessus, doivent etre pris en 
consideration comme etant representees dans le sens 5' 3'. 

Ainsi. le premier nucleotide d une sequence complementaire dans le sens 
5 -* 3' telle que decrite ci-dessus, est le complement du dernier nucleotide de 
la sequence dans le sens 5' -» 3' codant pour une CCR (ou fra S ment de CCR 
ou proteme derivee), le second nucleotide de cette sequence complementaire 
est le complement de I'avant-dernier nucleotide de la sequence codant pour 
une CCR, et a.nsi de suite, jusqu'au dernier nucleotide de ladite sequence 
complementaire qui est le complement du premier nucleotide de la sequence 
codant pour une CCR. 

L'ARNm code par la sequence complementaire susmentionnee est tel 
que, lorsque cet ARNm est represente dans le sens 5' -> 3' son premier 
nucleotide correspond au dernier nucleotide de la sequence codant pour une 
CCR, et done s'hybride avec le dernier nucleotide de l'ARNm code par cette 
dermere. tandis que son dernier nucleotide correspond au premier nucleotide 
de la sequence codant pour une CCR, et done s'hybride avec le premier 
nucleotide de l'ARNm code par cette derniere. 

Ainsi. on entend par ARNm antisens dans ce qui precede et ce qui suit 
tout ARNm code par la susdite sequence complementaire et represente dans le 
sens inverse (3' -> 5 ') du sens dans lequel est represente .'ARNm code par la 
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sequence codant pour une CCR (ou fragment de CCR ou proteine derivee), ce 
dernier ARNm etant encore designe ARNm sens (5' -> 3'). 

Le terme d'ARN antisens s'adresse done a une sequence d'ARN 
complementaire de la sequence en bases de I'ARN messager. le terme 
> complementaire devant etre compris en ce sens que chaque base (ou une 
majorite de bases) de la sequence antisens (lue dans le sens 3' -» 5') est 
capable de s'apparier avec les bases correspondantes (G avec C, A avec U) de 
I'ARN messager (sequence lue dans le sens 5" -> 3"). 

La strategie des ARN antisens, dans le cadre de la presente invention, 
io est une approche moleculaire particulierement adaptee a I'objectif d'une 
modulation des taux de lignines des plantes. L'ARN antisens est un ARN 
produit par la transcription du brin d'ADN non codant (brin non-sens). 

Cette strategie antisens est plus particulierement decrite dans le brevet 
europeen n° 240 208. 

i> On pense que I'inhibition de la synthese d'une proteine selon la strategie 

antisens. en I'occurrence de la CCR dans le cas present, est la consequence de 
la formation d un duplex entre les deux ARN complementaires (sens et 
antisens) empechant ainsi la production de la proteine. Le mecanisme 
cependant reste obscur. Le complexe ARN-ARN peut interferer soit avec une 
20 transcription ulterieure, soit avec la maturation, le transport ou la traduction 
ou bien encore conduire a une degradation de l'ARNm. 

Une combinaison de ces effets est egalement possible. 
L' invention concerne egalement tout ARNm code par une sequence 
d'ADN selon 1' invention, et plus particulierement: 

- l'ARNm code par la sequence d'ADN representee par SEQ ID NO 1, 
ou code par un fragment ou une sequence derivee tels que definis ci-dessus, 
ledit ARNm etant susceptible de coder a son tour pour la CCR presente chez 
la luzerne, telle que representee par SEQ ID NO 2, ou pour un fragment de 
cette CCR ou une proteine derivee tels que definis ci-dessus, 
30 " ' ARNm code par la sequence d'ADN representee par SEQ ID NO 3, 

ou code par un fragment ou une sequence derivee tels que definis ci-dessus, 
ledit ARNm etant susceptible de coder a son tour pour la CCR presente chez 
le mais, telle que representee par SEQ ID NO 4, ou pour un fragment de cette 
CCR ou une proteine derivee tels que definis ci-dessus. 
35 L' invention a egalement pour objet tout ARNm antisens, tel que defini 

ci-dessus, caracterise en ce qu'il comprend des nucleotides complementaires 
de la totalite ou d'une partie seulement des nucleotides constituant un ARNm 
tel que decrit ci-dessus selon I 'invention, ledit ARNm antisens etant 
susceptible de s'hybrider (ou de s'apparier) avec ce dernier. 
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codes IrV^' ' inVen " 0n " iSe P ' US <>* n ™>™™ « •« ARNm amisens 
In „ d " SeqUenCeS d ' ADN comprenan, au moins une 

eg.on de 50 bases homo.ogues a ce„es d une region des sequences 
co mpl emema,res des sequences d'ADN susment.onnees de linvemion 

II n y a pas de limi.e superieure de .aille pour les sequences d'ADN 
codan, pour u„ ARN an,ise„s se.on .'invent; ell es peuven, etre auss, 
longues que celle, du messager normafcmen, produ,, dans ,es ceUules voire 
auss, iongues que la sequence d'ADN genornique codan, pour I 'ARNm dc ,a 

Avamageusemera, de telles sequences d'ADN codan, pour un ARN 
aniens selon r.nvemion. comprennen, entre environ ,00 « environ 

1UOO paires de bases. 

L'invention a plus particulierernent pour objet toute sequence antisens 
comprenant un (ou plusieurs) ARNm antisens te.(s) que decrit(s, ci-dessus ou 
fragment) de cet (ces) ARNm antisens, et une (ou p. usieurs) sequences) 
correspondant a un (ou plusieurs) domaine(s) catal y ti q ue ( s) dun ribozyme 

A ce utre, 1'mvention vise plus particulierernent toute sequence antisens 
telle que decrite ci-dessus. comprenant le doma.ne catalyt.que dun ribozyme 
flanque de part et d'autre par des bras d'environ 8 bases complementaires des 
sequences bordant un motif GUX (X representant C, U ou A) comprises dans - 
l un des ARNm de Invention decrits ci-dessus (encore des.gnes ARN cbles) 
(Haseloff J.. et Gerlach W. L., 1988. Nature, 334: 585-591). 

L'invention concerne egalement toute sequence d'ADN susceptible de 
coder pour une sequence antisens telle que decrite ci-dessus comprenant au • 
moms un domaine catalytique d'un ribozyme lie a un ou plusieurs ARNm 
anusens de .'invention, ou fra gment(s) d'ARNm antisens (avantageusement 
des fragments d'environ 8 bases tels que decrits ci-dessus). 
L'invention a plus particulierernent pour objet: 

- tout ARNm antisens, tel que deer it ci-dessus, caracterise en ce qu'il est 
code par la sequence nuc.eotidique complementaire de cel.e representee par 
SEQ ID NO 1, ledit ARNm antisens etant susceptible de s'hybrider avec 
1 ARNm code par la sequence d'ADN representee par SEQ ID NO 1 

- tout ARNm antisens, tel que decrit ci-dessus, caracterise en ce qu'il est 
code par la sequence nucleotidique complementaire de celle representee par 
SEQ ID NO 3, ledit ARNm antisens etant susceptible de s'hybrider avec 
1 ARNm code par la sequence d'ADN representee par SEQ ID NO 3 

L'invention concerne egalement les polypeptides recombinants codes par 
les sequences d'ADN de .'invention, .esdits polypeptides recombinants 
presentant une activite enzymatique equ.valente a celle des CCR chez les 
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plantes, et plus particulierement les CCR recombinantes codees par les 
sequences representees par SEQ ID NO 1 et SEQ ID NO 3, ou par des 
sequences derivees de ces dernieres selon V invention. 

L' invention a plus particulierement pour objet les polypeptides 
5 recombinants, et notamment les CCR recombinantes, tels qu'obtenus par 
transformation de cellules vegetales en integrant de fagon stable dans leur 
genome, une sequence nucleotidique recombinante telle que definie ci-apres, 
contenant une sequence d'ADN selon l 1 invention, notamment a 1'aide d'un 
vecteur tel que decrit ci-apres. 

io Par T expression "polypeptides recombinants", on doit entendre toute 

molecule possedant une chaine polypeptidique susceptible d'etre produite par 
genie genetique, par 1' intermediate d'une phase de transcription de I'ADN du 
gene correspondant, ce qui conduit a 1'obtention d'ARN qui est par la suite 
transforme en ARNm (par suppression des introns), ce dernier etant ensuite 

15 traduit par les ribosomes, sous forme de proteines. le tout etant effectue sous 
controle d'elements de regulation appropries a 1'interieur d'une cellule hole. 
Par consequent, 1' expression "polypeptides recombinants" utilisee n'exclut pas 
la possibilite que lesdits polypeptides comprennent d'autres groupements, tels 
que les groupements glycosyles. 

20 Bien entendu, le terme "recombinant" indique que le polypeptide a ete 

produit par genie genetique, car il resulte de l'expression, dans un hote 
cellulaire approprie, de la sequence nucleotidique correspondante qui a ete 
auparavant introduite dans un vecteur d'expression utilise pour transformer 
ledit bote cellulaire. Toutefois, ce terme "recombinant" n'exclut pas la 

25 possibilite que le polypeptide soit produit par un procede different, par 
exemple par synthese chimique classique selon les methodes connues utilisees 
pour la synthese de proteines, ou par clivage proteolytique de molecules de 
plus grande taille. 

L' invention concerne plus particulierement la CCR telle que presente 
30 dans les cellules de luzerne et representee par SEQ ID NO 2 ou la CCR telle 
que presente dans les cellules de mais et representee par SEQ ID NO 4, 
lesdites CCR etant telles qu'obtenues sous forme essentiellement pure par 
extraction et purification a partir de luzerne ou de mats, ou toute proteine 
derivee de ces dernieres, notamment par addition, et/ou suppression, et/ou 
35 substitution d'un ou plusieurs acides amines, ou tout fragment issu desdites 
CCR ou de leurs sequences derivees, lesdits fragments et sequences derivees 
etant susceptibles de posseder une activite enzymatique equivalente a celle des 
CCR susmentionnees. 
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L' invention a egalement pour objet les sequences nucleotidiques codant 
pour la CCR representee par SEQ ID NO 2 ou SEQ ID NO 4 ou toute 
sequence derivee ou fragment de ces dernieres, tels que definis ci-dessus. 
iesdites sequences nucleotidiques etant caracterisees en ce qu'elles 
correspondent a tout ou partie des sequences representees par SEQ ID NO 1 
ou SEQ ID NO 3 respectivement. ou a toute sequence derivee de ces dernieres 
par degenerescence du code genetique. et etant neanmoins susceptibles de 
coder pour les CCR ou sequence derivee ou fragment de ces dernieres. tels 
que definis ci-dessus. 

L' invention vise egalement les complexes formes entre les ARNm 
antisens, tels que decrits ci-dessus, et les ARNm selon Invention, 
susceptibles de coder pour tout ou partie d une CCR chez les plantes. 

L' invention a plus particulierement pour objet le complexe forme entre 
I 'ARNm code par la sequence SEQ ID NO 1 et I' ARNm antisens code par la 
sequence complementaire de la sequence SEQ ID NO 1. ainsi que le complexe 
forme entre l'ARNm code par la sequence SEQ ID NO 3 et I'ARNm antisens 
code par la sequence complementaire de la sequence SEQ ID NO 3. 

L' invention a plus particulierement pour objet toute sequence 
nucleotidique recombinante (ou ADN recombinant), caracterisee en ce qu'elle 
comprend au moins une sequence d'ADN selon 1'invention, choisie parmi 
celles decrites ci-dessus, ladtte sequence d'ADN etant inseree dans une 
sequence heterologue. 

L' invention concerne plus particulierement toute sequence nucleotidique 
recombinante telle que decrite ci-dessus, comprenant, a titre de region 
codante, la sequence nucleotidique representee par SEQ ID NO 1. ou par 
SEQ ID NO 3, ou tout fragment ou une sequence nucleotidique derivee de ces 
dernieres, tels que definis ci-dessus, Iesdites sequences nucleotidiques ou ledit 
fragment etant inseres dans une sequence heterologue, et etant susceptibles de 
coder pour la CCR representee par SEQ ID NO 2, ou par SEQ ID NO 4 
respectivement, ou pour un fragment de ces CCR, ou pour une proteine 
derivee de ces dernieres, tels que definis ci-dessus. 

L' invention concerne plus particulierement encore, toute sequence 
nucleotidique recombinante comprenant, a litre de region codante, une 
sequence nucleotidique complementaire de celle representee par 
SEQ ID NO 1, ou par SEQ ID NO 3. ou tout fragment ou toute sequence 
nucleotidique derivee de cette sequence complementaire, tels que definis ci- 
dessus, Iesdites sequences complementaires ou ledit fragment etant inseres 
dans une sequence heterologue, et etant susceptibles de coder pour un ARNm 
antisens capable de s'hybrider avec tout ou partie de I'ARNm codant pour une 
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CCR chez les plantes, et plus particulierement avec tout ou partie de I'ARNm 
codant pour la CCR representee par SEQ ID NO 2, ou par SEQ ID NO 4. 

Les ADN recombinants selon l' invention sont davantage caracterises en 
ce qu'ils comprennent les elements necessaires pour reguler I'expression de la 



complementaire codant pour un ARNm antisens selon I' invention, notamment 
un promoteur et un terminateur de la transcription de ces sequences. 

Parmi les differents promoteurs susceptibles d'etre utilises dans les 
constructions d'ADN recombinants selon V invention, on peut citer: 



plante, notamment le promoteur situe en amont de la sequence d'ADN 
representee par SEQ ID NO 5 codant chez I'eucalyptus pour la CCR 
representee par SEQ ID NO 6, ou 

- des promoteurs de type constitutif a forte expression, exemples: 
15 35 S CAMV (decrit dans Benfey et al. (1990), EMBO J., 9 (6), 1677-1684). 

EFla (promoteur du gene d'un facteur d'elongation dans la synthese proteique 
decrit par Curie et al. (1991), Nucl. Acids Res., 19, 1305-1310), 

- des promoteurs de type specifique a expression particuliere dans des 
tissus individuels, exemples: promoteur CAD (decrit par Feuillet C. (1993), 

20 These de I'Universite de Toulouse III), promoteur GRP 1-8 (decrit par Keller 

et Baumgartner, (1991), Plant Cell., 3, 1051-1061) a expression dans des 

tissus vasculaires specifiques. 

L' invention concerne egalement toute sequence nucleotidique 

recombinante telle que decrite ci-dessus, et comprenant egalement a titre de 
25 region codante au moins une sequence nucleotidique codant pour tout ou partie 

d un ARNm codant lui-meme pour une autre enzyme que la CCR, qui se 

trouve etre impliquee dans une etape de la biosynthese des lignines chez les 

platues, notamment I'ARNm codant pour Talcool cinnamylique 

deshydrogenase (CAD), ou comprenant egalement a titre de region codante au 
30 mains une sequence nucleotidique codant pour tout ou partie d'un ARNm 

antisens susceptible de s'hybrider avec I'ARNm susmentionne, notamment 

avec I'ARNm codant pour la CAD. 

Les sequences nucleotidiques recombinantes susmentionnees de 

I* invention sont avantageusement obtenues a partir de vecteurs dans lesquels 
35 sont inserees les sequences d'ADN codant pour une enzyme necessaire a la 

biosynthese des lignines chez les plantes. 

Les vecteurs susmentionnes sont digeres a Taide d* enzymes de 

restriction appropriees afin de recuperer lesdites sequences d'ADN qui s'y 

trouvent inserees. 



sequence nucleotidique codant pour une CCR, ou de sa sequence 



10 



- le promoteur endogene controlant Texpression de la CCR chez une 
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Ces dernieres sent ensuite inserees en aval d un promoteur approprie ei 
en amont d'un terminates approprie de .'expression, au sein des ADN 
recombinants selon I' invention. 

Invention vise plus particulierement les ADN recombinants 
comprint , a .quence representee par SEQ ID NO 1 ou celle ^p,,.^ 
ID N ° 3 ' tClS « uob < e ™s par digestion de vecteurs susmentionnes 
recuperation de .a sequence d'ADN de invention et insertion deTe e 
derniere dans .e sens 5' - 3', au sein d'une sequence d'ADN he*rologu 
comprenant un promoteur et un terminates de ,'ex P re SS i on de ladite sequence 
L invention a egalement plus particulierement pour objet les ADN 
recombinants comprenant la sequence complementaire de la sequence 



representee par SEQ ID NO 1, ou de celle representee par SEQ ID NO 3 te.s 
qu obtenus par digestion de vecteurs susmentionnes, recuperation de la 
sequence d'ADN de .'invention, et insertion de cette derniere en sens inverse 
c est-a-d,re dans le sens 3' -> 5', au sein d'une sequence d'ADN heterologue 
comprenant un promoteur et un terminates de . expression de la sequence 
complementaire. 

A .itre dexemple de .ermina.eur u.ilisable dans de ,elles cons.mc.ions 
on peu. ci.er Pex.remLe 3' du gene de la nopaHne symhase « A S ro b aaer,u,n 

w tumefaciens. 

Ainsi, dune maniere generate, les sequences nucleotidiques 
recombinants se.on Invention, contenant une sequence d'ADN codant pour 
une CCR (ou fragment de CCR ou proteine derivee), et/ou d'autres enzymes 
necessaires a la biosynthese des lignmes. sont obtenues par recuperation de 

- ladtte sequence d'ADN a partir des vecteurs susmentionnes, et insertion de 
cette sequence dans la sequence heterologue, tandis que les sequences 
nucleotidiques recombinantes contenant une sequence d'ADN codant pour un 
ARNm antisens selon .'invention, sont obtenus par recuperation de .a sequence 
d ADN susmention.ee et insertion en sens inverse de cette derniere dans ladite 

0 sequence heterologue. 

A titre d'illustration, on peut utiliser tout ou partie de I'ADN 
complementaire (ADNc) represent par SEQ ID NO 1 ou SEQ ID NO 3 pour 
a construction des ADN recombinants susmentionnes, ou bien tout ou partie 
du clone genomique correspondant a une CCR (qui correspond aux ADNc 

- susmentionnes + d'eventuels introns). Ce clone genomique peut etre obtenu 
en utUisant les ADNc comme sondes pour crib.er une banque genomique, cette 
derniere etan, e.le-meme obtenue suivant la methode decrite par Sambrook 
Fntsch et Maniat.s, Mo.ecu.ar Cloning Laboratory Manual, Co.d Sprin* 
Harbour Laboratory Press, 1989. 
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L' invention a egalement pour objet tout vecteur recombinant, utilisable 
pour la transformation de plantes, caracterise en ce qu'il comprend une 
sequence nucleotidique recombinarite choisie parmi celles decrites ci-dessus, 
selon T invention, integree dans Tun des sites de son genome non essentiels 
pour sa replication. 

Parmi les vecteurs recombinants susmentionnes utilisables pour la 
transformation de plantes, on peut citer: les vecteurs binaires derives de pBIN 
19 (Bevan et al., (1984). Nucl. Acids Res., 12 (22), 871 1-8721). 

Des exemples de construction de vecteurs recombinants selon 1' invention 
sont decrits dans la description detaillee qui suit de T invention. 

La presente invention a egalement pour objet un procede de regulation 
de la biosynthese des lignines chez les plantes, soit par diminution, soit par 
augmentation des quantites de lignines produites, par rapport aux quantites 
normales de lignines produites chez ces plantes, ledit procede comprenant une 
etape de transformation de cellules de ces plantes a I'aide d un vecteur 
contenant: 

- la sequence nucleotidique representee par SEQ ID NO 1 ou par SEQ 
ID NO 3 ou un fragment des sequences nucleotidiques susmentionnees, ce 
fragment codant pour un ARNm, cet ARNm codant lui-meme pour un 
fragment d'une CCR chez les plantes, ce fragment de CCR presentant une 
activite enzymatique equivalente a celle de la CCR representee par SEQ ID 
NO 2 ou par SEQ ID NO 4, ou d'une sequence nucleotidique derivee des 
sequences nucleotidiques susmentionnees, ou derivee du fragment 
susmentionne, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution dun ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm, cet ARNm codant lui-meme pour une proteine derivee 
presentant une activite enzymatique equivalente a celle de Tune au moins des 
CCR susmentionnees, ou 

- une sequence nucleotidique complementaire de tout ou partie des 
sequences nucleotidiques representees par SEQ ID NO 1 ou par SEQ ID NO 3 
codant pour un ARNm, ou du fragment de ces sequences, ou de la sequence 
derivee de ces derniers, tels que definis ci-dessus, cette sequence 
complementaire codant pour un ARNm antisens susceptible de s'hybrider avec 
Tun des ARNm susmentionnes, 

ladite transformation etant effectuee notamment a I'aide d'un vecteur tel que 
decrit ci-dessus. 

L' invention a plus particulierement pour objet un procede de diminution 
de la quantite de lignines produites par biosynthese chez les plantes, ce 



BNSDOCID: <WO 9712982A1_L> 



10 



20 



30 



WO 97/12982 — - n ^ ~ 

PCT/FR96/01544 

-16- 

procede etant effectue par transformation du genome de ces plantes, en y 
incorporant: 

- au moins une sequence d'ADN selon Invention telle que decrite ci- 
dessus, codant pour un ARNm antisens susceptible de s'hybrider avec tout ou 
partie de I'ARNm codant pour la CCR representee par SEQ ID NO 2 ou SEQ 
ID NO 4. ou pour une proteine derivee de ces dernieres telle que definie ci- 
dessus, 

- et. le cas echeant, au moins une sequence d'ADN codant pour un 
ARNm antisens capable de s'hybrider a un ARNm codant pour une autre 
enzyme que la CCR, qui se trouve etre impliquee dans une etape de la 
b.osynthese des lignines chez les plantes, notamment I'ARNm codant pour la 
CAD. 

ladite transformation etant realisee. 

- soil a I'aide d'un vecteur recombinant tel que decrit ci-dessus 
contenant une sequence d'ADN codant pour un ARNm antisens capable de 
s'hybnder avec I'ARNm codant pour la CCR ou pour une proteine derivee. 
telle que definie ci-dessus, et, le cas echeant, contenant une ou plusieurs 
sequence(s) d'ADN codant pour un ARNm antisens capable de s'hybrider a un 
ARNm codant pour une autre enzyme que la CCR telle que definie ci-dessus, 

-son a I'aide de plusieurs vecteurs recombinants dont l'un au moins 
contient une sequence d'ADN codant pour un ARNm antisens capable de 
s'hybrider avec I'ARNm codant pour la CCR ou pour une proteine derivee, 
telle que definie ci-dessus, tandis que 1' (ou les) autre(s) vecteur(s) 
recombinant(s) contien(nen)t une sequence d'ADN codant pour un ARNm 
antisens capable de s'hybrider a un ARNm codant pour une autre enzyme que 
la CCR, telle que definie ci-dessus. 

Un autre procede de diminution de la quantite de lignines produites par 
biosynthese chez les plantes, est celui realise par transformation du genome de 
ces plantes. en y incorporant: 

- au moins une sequence d'ADN selon 1'invention representee par 
SEQ ID NO 1 ou SEQ ID NO 3, ou un fragment ou une sequence derivee de 
cette derniere, tels que definis ci-dessus, 

- et, le cas echeant, au moins une sequence d'ADN codant pour tout ou 
partie d'une autre enzyme que la CCR, qui se trouve etre impliquee dans une 
etape de la biosynthese des lignines chez les plantes. notamment une sequence 
d'ADN codant pour tout ou partie de la CAD, 
ladite transformation etant realisee: 

- soit a I'aide d'un vecteur recombinant tel que decrit ci-dessus 
contenant la sequence d'ADN selon 1'invention susmentionnee, ou un fragment 
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ou une sequence derivee de cette derniere, tels que definis ci-dessus, et, le cas 
echeam, contenant une ou plusieurs sequence(s) d'ADN codant pour tout ou 
partie d'une enzyme autre que la CGR, telle que definie ci-dessus. 

- soit a I'aide de plusieurs vecteurs recombinants dont Tun au moins 
contient une sequence d'ADN selon !' invention susmentionnee, ou un 
fragment ou une sequence derivee de cette derniere, tels que definis ci-dessus, 
tandis que V (ou les) autre(s) vecteur(s) recombinant(s) contien(nen)t une 
sequence d'ADN codant pour tout ou partie d'une enzyme autre que la CCR, 
telle que definie ci-dessus. 

Cette derniere methode fait appel au mecanisme de co-suppression. La 
co-suppression a ete observee quand des copies du gene endogene ont ete 
introduites dans le genome. Bien que le mecanisme de la co-suppression soit 
actuellement inconnu, une des hypotheses les plus frequemment retenue est 
que la regulation negative de l'expression du gene viendrait de la production 
d'une faible proportion d'ARN antisens derivee d'un transgene a travers une 
lecture du "mauvais" brin du transgene (Grierson et al. t Trends Biotech., 9: 
122-123). 

L' invention a egalement pour objet un procede de diminution de la 
quantite de lignines produites par biosynthese chez les plantes, ce procede 
etant realise par transformation du genome de ces plantes en y incorporant une 
sequence d'ADN telle que decrite ci-dessus selon i' invention, codant pour une 
sequence antisens comprenant un (ou plusieurs) domaine(s) catalytique(s) d'un 
ribozyme lie(s) a un (ou plusieurs) ARNm antisens, ou fragment(s) d'ARNm 
antisens de 1' invention, ladite transformation etant realisee a I'aide d'un 
vecteur recombinant comprenant une sequence nucleotidique recombinante 
selon T invention contenant elle-meme la sequence d'ADN susmentionnee. 

II est important de noter que les methodes susmentionnees permettent 
d'aboutir a des plantes transformees presentant des niveaux differents de 
reduction de l'activite CCR (selon le niveau d' insertion de la sequence d'ADN 
codant pour l'ARNm antisens, le nombre de copies de cette sequence d'ADN 
integree dans le genome...), et done des teneurs en lignines. 

Le choix des transformants permettra done une modulation controlee des 
teneurs en lignines compatible avec un developpement normal de la plante. 

D'une maniere generale, si Ton considere que la teneur moyenne 
normale en lignines d'une plante varie entre environ 15% et environ 35% en 
poids de matiere seche, la reduction de la teneur en lignines resultant de la 
mise en oeuvre d'un des precedes susmentionnes, est avantageusement telle 
que les plantes ainsi transformees presentent une teneur moyenne en lignines 
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variant entre environ 10% et environ 30%, ou encore entre environ P% « 

environ 32%. - " ci 

A titre d'illustrauon, la teneur en .ignines d'une plante peut etre mesuree 
selon une variante de la methode de Johnson et al., (1961) T A P P I 44 
793-798. qui est decrite en detail dans Alibert et Boudet (1979) Physiol ' 
Veg., 17 (1). 67-74, et dont les principales etapes sont les suivantes- apres 
obtent.on d'une poudre alcool benzene contenant les iignines du materiel 
vegetal, les Hgnines sont solubilisees par .e bromure d'acety.e et dosees en 
fonction de leur absorption dans I'ultraviolet. 

Lmvention vise plus particulierement 1'application des procedes 
susmentionnes de dimmution des teneurs en lignines dans les plantes a 
I obtent.on de plantes fourrageres transformees genetiquement, presentant des 
teneurs en lignines reduites par rapport aux teneurs normales en l, 8 nmes chez 
ces plantes. et dont la digestibilite se trouve etre ainsi amelioree paV rapport a 
ces memes plantes non transformees. 

Parmi les principales plantes fourrageres susceptibles d'etre transformees 
dans le cadre de la presente invention, on peut citer: la luzerne. la fetuque le 
mais destine a l'ensilage, etc... 

L'invention concerne egalement Implication des procedes 
susmemtonnes de diminution des teneurs en lignines chez les plantes a 
I'obtention de plantes, et plus particulierement d'arbres, transformes 
g enet.que m ent, presentant des teneurs en lignines reduites par rapport aux 
teneurs normales en lignines chez ces plantes, ces plantes ou arbres etant 
parncuhercment avamageux a utiliser dans le cadre de la production de la pate 
a papier. v 

Un troisieme domaine potentiel d'application des procedes 
susment.onnes de regulation negative de l'cxpression du gene de la CCR 
concerne la stimulation de la croissance des plantes transformees Divers 
arguments soulignent (Sauter et Kende, 1992, Plant and Cell Physiology 33 
(8): 1089), qu'une Unification precoce et rapide est une fre.n au grandissement 
cellulatre et done a la croissance des vegetaux. Ainsi la mise en oeuvre des 
procedes susmentionnes est susceptible de permettre pour les plantes ainsi 
transformees a lignification reduite une meilleure croissance et done de 
meilleurs rendements. 

^invention concerne egalement un procede d' augmentation de la 
quantite de hgn.nes produites par biosynthese chez les plantes, ce procede 
etant effectue par transformation du genome de ces plantes, en y incorporant 
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- au moins une sequence d'ADN selon i* invention representee par 
SEQ ID NO 1 ou SEQ ID NO 3. ou un fragment ou une sequence derivee de 
cette demiere, tels que definis ci-dessus, 

- et, le cas echeant, au moins une sequence d'ADN codant pour tout ou 
5 partie d'une autre enzyme que la CCR, qui se trouve etre impliquee dans une 

etape de la biosynthese des lignines chez ies plantes, notamment une sequence 
d'ADN codant pour tout ou partie de la CAD, 
ladite transformation etant realisee: 

- soit a I'aide d'un vecteur recombinant tel que decrit ci-dessus, 
id contenant ia sequence d'ADN selon 1' invention susmentionnee, ou un fragment 

ou une sequence derivee de cette demiere, tels que definis ci-dessus, et, le cas 
echeant, contenant une ou plusieurs sequence(s) d'ADN codant pour tout ou 
partie d'une enzyme autre que la CCR, telle que deftnie ci-dessus. 

- soit a I'aide de plusieurs vecteurs recombinants dont Tun au moins 
15 contient une sequence d'ADN selon 1'invention susmentionnee, ou un 

fragment ou une sequence derivee de cette demiere, tels que definis ci-dessus, 
tandis que 1' (ou Ies) autre(s) vecteur(s) recombinant(s) contien(nen)t une 
sequence d'ADN codant pour tout ou partie d'une enzyme autre que la CCR, 
telle que definie ci-dessus. 

-0 D'une maniere generate, toujours si Ton considere que la teneur 

moyenne normale en lignines d'une plante varie entre environ 15% et environ 
35% en poids de matiere seche, Augmentation de la teneur en lignines 
resultant de la mise en oeuvre du procede susmentionne, est avantageusement 
telle que les plantes ainsi transformees presentent une teneur moyenne en 

25 lignines variant entre environ 20% et environ 40%, ou encore entre environ 

18% et environ 38%. 

L' invention vise plus particulierement lapplication du procede 
susmentionne d* augmentation des teneurs en lignines dans les plantes (encore 
designe procede de surexpression du gene de la CCR), a l'obtention de plantes 

30 transformees genetiquement, presentant des teneurs en lignines augmentees par 
rapport aux teneurs normales en lignines chez ces plantes, et dont les 
proprietes de resistance a des attaques de l'environnement, notamment a des 
attaques parasitaires, se trouvent etre ainsi ameliorees par rapport a ces memes 
plantes non transformees. II est particulierement avantageux dans ce dernier 

35 cas, d'utiliser en association avec le gene CCR, ou une sequence derivee, dans 
les vecteurs susmentionnes, des promoteurs specifiques particulierement 
exprimes dans les tissus de surface et/ou en reponse a la blessure. 



Par ailleurs, 1'invention concerne egalement Tapplication du procede 
susmentionne de surexpression du gene de la CCR, a Amelioration de la 
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croissance des plantes ainsi transformees genetiquement, notamment dans 
certains -domaines- .els que 1 'horticulture ou 1 arboriculture, ou il est 
souha.table d'obtenir des plantes de dimension reduite 

Enfin, les cycles benzeniques de la .ignine ont une plus arande energie 
■ ntnnseque que les chaines a.iphatiques des res.dus g.ucose de la ce.lulo 
Am... , a jon de la proportion ^ ijgmnes chez £ 

H COmb 1 USt ' b,eS - Sd0n ' e Pr ° C6d6 SUS — ^ * '-vent-on, pe rm 

,e potent,ei wue de - ^ — ; a , nsi 

Dans les deux cas de regulation negative ou de surexpress.on de la CCR 
.1 est tout a fait envisageable que la modu.ation de cette activite se repercute 
sur la teneur en l.gnines des plantes transformees. En effet, la CCR dont le 
niveau dactivite est tres bas dans la plante. semble constituer lenzvme 
regulatnce de la synthese des lignines. 

Sagissant des techniques de transformation utilisees pour la mise en 
oeuvre d'un des procedes decrits ci-dessus de 1 ■invention, on aura 
avantageusement recours aux techniques suivantes: 

A) La technologie de transformation par T intermediate du plasmide Ti 
d Agrobacterium tumefaciens decrite par Bevan (1984) Nucleic Add Research 
12: 8711-8721. Elle fait appel essentiellement a la methode de co-culture el 
fan mtervenir une co-transformation avec un gene de selection pour pouvoir 
reperer les transformants. 

Elle est particulierement applicable aux dicotyledones, ex tabac 
luzerne, colza. 

B) La technique de transfert direct de genes par biolist.que decrite en 
deta,l par (Zumbrum et al.. 1989, Technique 1, 204-216; Sanford et al 1991 
Technique 3, 3-16). ' ' 

Cette technique implique l'association de I'ADN recombinant selon 
.nvenuon a des microparticules d'or ou de tungstene qui sont propulsees a 
a.de d'un canon a particules sur le t.ssu a transformer. Elle sera 

particuherement appliquee a la transformation d'especes refractaires aux 

agrobacteries. 

Dans les deux cas susmentionnes, la verification de la presence de 
1 ADN recombinant selon .'invention sera realisee par des experiences 
d hybndation de type southern et d' amplification genique (polymerase chain 
reacnon), a 1'aide de sondes et d'amorces oligonucleotidiques issues 
notamment de la sequence SEQ ID NO 1 ou SEQ ID NO 3. 

L' invention concerne egalement les cellules de plantes transformees par 
un vecteur selon Invention, notamment par les techniques decrites ci-dessus. 
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et comprenant une sequence d'ADN selon 1* invention integree de fa^on stable 
dans leur genome. 

L' invention vise egalement les plantes transformees telles qu'obtenues 
par culture des cellules transformees susmentionnees. 

Les plantes transformees peuvent etre ensuite propagees par voie 
sexuelle ou par voie vegetative in vitro ou in natura. 

L' invention a egalement pour objet les fragments de plantes. notamment 
fruits, semences, pollen, transformes par incorporation dans leur genome 
d'une sequence d'ADN selon I* invention, a 1'aide des vecteurs recombinants 
susmemionnes. 

L' invention concerne egalement les anticorps diriges contre les 
polypeptides recombinants de I'invention, et plus particulierement ceux diriges 
contre les CCR recombinantes susmentionnees. 

De tels anticorps peuvent etre obtenus par immunisation d'un animal 
avec ces polypeptides suivie de la recuperation des anticorps formes. 

II va de soi que cette production n'est pas limitee aux anticorps 
polyclonaux. 

Elle s applique encore a tout anticorps monoclonal produit par tout 
hybridome susceptible d'etre forme, par des methodes classiques, a partir des 
cellules spleniques d'un animal, notamment de souris ou de rat, immunises 
contre Tun des polypeptides purifies de l'invention d'une part, et des cellules 
d'un myelome approprie d'autre part, et d'etre selectionne, par sa capacite a 
produire des anticorps monoclonaux reconnaissant le polypeptide 
susmentionne initialement mis en oeuvre pour 1' immunisation des animaux. 

L' invention vise egalement l'utilisation des anticorps susmentionnes 
diriges contre les polypeptides recombinants de Tinvention, pour la mise en 
oeuvre d'une methode de detection ou de dosage des CCR chez les plantes, a 
partir d'echantillons preleves chez ces dernieres. 

II convient de preciser que sont exclues des sequences nucleotidiques de 
1' invention et de leur utilisation susmentionnee, les sequences nucleotidiques 
representees par SEQ ID NO 5, SEQ ID NO 7, SEQ ID NO 9 et 
SEQ ID NO 11, codant respectivement pour la CCR d'eucalyptus representee 
par SEQ ID NO 6, la CCR de peuplier representee par SEQ ID NO 8, la CCR 
de fetuque representee par SEQ ID NO 10, et la CCR de tabac representee par 
SEQ ID NO 12, ainsi que la sequence representee par SEQ ID NO 13 codant 
pour la proteine representee par SEQ ID NO 14 derivee de la CCR 
d'eucalyptus susmentionnee. 

De meme, sont exclues des sequences nucleotidiques de 1' invention et de 
leur utilisation susmentionnee, les sequences complementaires des sequences 
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e, SEQ ID NO 13, ams, que les fragmems ou sequences der.vees de ces 
sequences nuc,eo,.d,ques ou de ,eurs sequences 

mesure ou ces fragmems e, sequences derivees son, idemiques aux fraZn 
e, sequences derivees, ,e,s que deflnis c-dessus. des sequen u ^ d7 
representees par SEQ ID NO 1 e i SFO tn m„ , nucleolidiques 
comp.ememaires. ° ' e ' SEQ ID N0 3 °" * >eurs sequences 

Son, egalemen, exclus du cadre de la preseme inven.ion 

SidI™ 

en„ques aux fragment e, sequences , els que defin.s o-dess de 

sequences representees par SEQ ID NO 1 e, SEQ ID NO 3 

ARNm ARNm antiSenS Q ° nS " m " de nUCl<0 ' ideS «™P'™en,aires des 

ARNm susmentionnes, 

- les polypeptides represents par SEQ ID NO 6 SEO ID NO 8 
SEQ ID NO 10. SEQ ID NO 12 e, SEQ ID NO ,4. a.nsi que £ £Z ou 
=,ue„ce dertvee des poiypeptides susmen.ionnes. dans ,a mesurt ou c 
fragment ou sequence derivee son, idemiques aux fra gm e„,s e, sequence 

L' invention sera davantage detaillee dans la description qui suit de 
• o tent,on de ,a CCR sous forme purifiee chez 1'euca.yptus. et de 1'ADNc 
codant pour la CCR d'eucalyprus. de luzerne et du mais 

A) Detention de la CCR d eucalyptus purifiee, et de I'ADNc codant 
pour une CCR d'eucalyptus. 

I Purification ri P i a c <" R d pnr a i YP f 1n 

La CCR a fait Tobjet d'un nombre tres restreint d'etudes. P arm i les 
queJques publications la concernant, on peut citer 

Wengenmayer H Ebel J : , Grisebach H., 1976 - Enzymatic synthesis of 
hgntn precursors, punflcation and properties of , cinnarnoyl CoA; NaDpH 
reductase from eel, suspense cultures from soybean (Glycine maxh Eur J 
Biochem.. 65: 529-536. 

Lu^ T.. Grisebach H.. ,981 - En2ym a, ic S y„, h es,s of Mgnin 
precursors, comparison of cinna moy l: CoA reducase and cinnamy, aid, 
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dehydrogenase; NADP dehydrogenase from spruce (Picea abies L.) and 
soybean (Glycine max L), Eur. J. Biochem., 119: 115-127. 

Sarni F., Grand C, Boudet A.M., 1984 - Purification and properties of 
cinnamoyl: Co A reductase and cinnamyl alcohol dehydrogenase from poplar 
5 stems (Populus x eurameri carta). Eur. J. Biochem., 139: 259-265. 

Le travail decrit ci-apres a contribue a definir un protocole de 
purification original, simple et rapide de la CCR d'eucalyptus. Ce protocole 
est egalement plus efficace que ceux decrits precedemment dans la litterature. 
En effet. il a permis pour la premiere fois, 1'obtention de quantites d'enzyme 
io purifiee a homogeneite, suffisantes pour obtenir des sequences peptidiques 
internes et conduire a terme au clonage de l'ADNc correspondant. 

Toutes les etapes de purification de la CCR ont ete realisees a 4°C. 

1 Qbtention d'un extrait brut de xyleme d'eucalyptus. 



Le materiel vegetal a ete obtenu par "grattage" d'une fraction tissulaire 
enrichie en xyleme de branches d' Eucalyptus gunnii ages de 5 ans. 

300 g de xyleme prealablement congele dans V azote liquide ont ete 
reduits en poudre a 1'aide d'un moulin a cafe. Le broyat ainsi obtenu a ete 

20 homogeneise dans un litre de tampon d'extraction (100 mM Tris-HCl pH 7.6, 
2% PEG 6000, 5 mM DTT, 2% PVPP), filtre sur deux epaisseurs de 
Miracloth, et amene a 30% de la saturation en sulfate d' ammonium. Apres une 
centrifugation de 30 minutes a 15000xg, le culot obtenu est remis en 
suspension dans 60 ml de tampon 1 [20 mM Tris-HCl pH 7.5, 5 mM DTT 

25 (dithiothreitol), 5% ethylene glycol]. L'extrait ainsi obtenu est "clarifie" par 
une centrifugation de 15 min a 10 OOOxg, puis dessale par passage sur une 
Sephadex G25 equilibree dans le tampon 1. 

2, Chromatographic d f affmite su r Red Sepharose. 

30 

L'extrait brut dessale est depose sur une colonne d'affinite "Red 
Sepharose" (1.5 x 19 cm, Pharmacia), equilibree dans le tampon 1. Apres un 
premier ringage de la colonne par 50 ml de tampon 1 , les proteines sont eluees 
par un gradient lineaire de Tris de 20 mM a 1.5 M Tris-HCl pH7.5, contenant 
35 5 mM DTT, 5% ethylene glycol, Le volume total du gradient est de 200 ml et 
le debit de 36 ml/h. les fractions presentant une activite CCR sont regroupees 
et dessalees par passage sur une colonne de Sephadex G25, equilibree dans le 
tampon 1. 
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^-CiiromaTQpraphif Vfchwr a anion. « fr M » n »o 

Les fractions ainsi regroupees et dessalees sont chromatographies sur 
une colonne d'echange d'an.ons MonoQ (HR 5/5, Pharmacia). L'Lon 

e? 1 ™ ^H^;" " raPP ' iCati0n d ' Un gradiem ,in63Ire de 20 * 300 ™ 
en Tns-HCI pH 7... con tenant 5% d'ethylene glycol et 5 mM DTT Le 

volume total du gradient est de 50 ml et ,e debit de 1 ml/mm. Comme 
letape precedente. ,es fractions contenant .'enzyme CCR active son 
regroupees et dessalees, ma is dans ce cas ,e tampon dequil.brauon de 
colons de Sephadex G25 est un tampon phosphate 20 mM P H 7.6. contena 
5 mM DTT (tampon 2). 

4. Chromaroprnphie d'affi nife sur "Miny . ^ p H - 

Le groupe de fractions CCR ainsi obtenu est depose sur une co.onne 
M-meuc Red 2 A6XL (ACL, Cambridge). La colonne est prealab.ement lavee 
avec 30 ml de tampon 2 contenant 8 mM NAD. Ce lavage a pour but 
d dimmer des enzymes fonctionnant spectfiquement avec le NAD comme 
cofacteur, telle que la malate dehydrogenase qui copurifie avec la CCR dans 
les etapes precedentes. L'e.ution specif.que de la CCR est obtenue par 
application d'un gradient (15 ml) de NADP 0-8 mM dans le tampon o Les 
fractions contenant la CCR pure et active sont conserves a -80°C apres 
addition dun stabilisateur (ethylene glycol a la concentration finale de 5%) 

L'enzyme purif.ee ainsi obtenue presente une activite specifique de 451 
nXat/mg de proteine, en utilisant le fent.oy. CoA comme substrat Le 
rendement obtenu (36 Mg de proteine pure pour 300 g de materiel veeetal de 
depart) ne refiete pas la proportion de CCR ,„ pianta , en effet dans u~n souc, 
majeur d-e.tm.ner le maxtmum de contaminants a chaque etape de purificatton 
scales les fractions presentant une tres forte activite CCR sont traitees par 
1 etape suivante. Le facteur de purification obtenu par ce protoco.e est de 282 



35 



11 Car acrerisation de la ^ CR. 

La CCR d'eucalyptus est un monomere de 38kD comme en temoienent 
les resultats convergents obtenus pour la taille de I 'enzyme native^ par 
chromatographie d exc.usion sur Superose 6 (Pharmacia), et pour la tai.le de 
la sous-unite monomere sur gel d'electrophorese denaturant. Le point 
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isoelectrique, estime par chromatographic sur MonoP (Pharmacia) est proche 
de 7. 

La recherche du pH et du tampon optimum fait ressortir que la mesure 
de Tactivite CCR telle qu'elle a ete initialement decrite (Luderitz et Grisebach, 
5 1981), est parfaitement adaptee a la mesure de I'activite CCR d'eucalyptus 
(tampon phosphate 100 mM, pH 6.25). 

La purete de la CCR, presente a I'etat d'une bande unique sur gel 
d'electrophorese monodimensionnelle (SDS PAGE) a ete confirmee par 
I'obtention d'une seule tache ("spot") apres electrophorese bidimensionnelle et 
10 coloration a Largent. 

HI Obtention de 1'ADNr codant pour la CCR d'eucalyptus 

Afin de s'affranchir d'un eventuel probleme de contamination residuelle 
15 non detectable, 1* enzyme pure a ete soumise a une electrophorese preparative 
en conditions semi-denaturantes et digeree in situ dans le gel. La digestion a 
ete realisee a Taide d'endolysine C qui coupe specifiquement les proteines 
apres les residus lysine, permettant Tobtention de peptides relativement longs. 
Les peptides resultant de la digestion ont ete separes en phase reverse sur 
20 HPLC et certains d'entre eux ont ete sequences a Taide d'un microsequenceur 
de proteines (Applied Biosystems 470). Les sequences de ces peptides internes 
figurent ci-dessous: 

peptide 8 (a) Asn-Trp-Tyr-Cys-Tyr-Gly-Lys 

2* (b) His-Leu-Pro-Val-Pro-X-Pro-Pro-GIu-Asp-Ser-Val-Arg 

X representant tout acide amine 

peptide 10 Thr-Tyr-Ala-Asn-Ser-Val-Gln-Ala-Tyr-Val-His-Val-Lys 

30 peptide 13 Gly-Cys-Asp-Gly-Val-Val-His-Thr-Ala-Ser-Pro-Val-Thr-Asp-Asp 

peptide 1 7 Leu-Arg-Asp-Leu-Gly-Leu-Glu-Phe-Thr-Pro-Val-Lys 
peptide 18 Gly-Asp-Leu-Met-Asp-Tyr-Gly-Ser-Leu-Glu-GIu-Ala-Ile-Lys 

L'ADNc codant pour la CCR a ete obtenu par criblage a l'aide 
d' oligonucleotides d'une banque d'ADNc construite dans le phage X ZAPII 
(vecteur commercialement disponible, Stratagene) a partir de messagers 
extraits de xyleme d'Eucalyptus gunnii. 600 000 phages ont ete cribles a l'aide 
d'un groupe d'oligonucleotides degeneres marques a Textremite 3' au 
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Phosphore 32, a ,'aide d'une .eJi M | .ransferase. Las sequences des 
o , g o„uc,eo,,des u.i.is* pour ie criblage on, e,e determine parIi r 

quences pep t ,di q ues i„,ernes susmen.ionnees. Ces peptides ayan, e e gene 
par coupure a iendoiysme C . u„e iysine a e,e rajouree en pLita pos " n 

effe.. ce, ac.de am ,„e qu, „e pen, e,re code que par deux codons fai, panic 
des acdes am,„,s don, ,c code es, ,e mo ,„s de £ e„ere e, par con .quern 

:~ a fai * \ » de , q :::: 

de cON^T deS rt ° lig0nUcKMid " Pour .e crib,a S e de ,a banque 

de cDNA d eucalyptus denvees des acides amines souiignes (I , in05i l 
sont indiquees ci-apres: »ius»ine;, 

Peptide8 (a > Lvs-Asn-Trp-Tyf-^y J'yr^J^ 

oHgonucleotide 8 AA(A/G)AA(C/T)TGGTA(C/T)TG(C/T)TA(T/C)GGlAA 

p ; ptide 13 ^^^^^ 

Asp K 

oligonucleotide 13 AA(G/A)GGITG(C/T)GA(C/T)GGIGTIGTICA 

Pept.de 17 Lys-Leu-Arg-Asp-Leu-Gly-Leu-GJy*^^ 

oligonucleotide 17 GA(G/A)TT(C/T)ACfCCIGTIAA 

7"^ 18 L VS-G . V-A.SP-1 ni-Mrr ^lyr-Gly-Ser-Leu-Glu-G^u-Ala-ne-Lys 

oligonucleotide 18 AA(G/A)GGIGA(C/T)(C/T)TIATGGA(C/T)TA(C/T)GG 

Les conditions dhybridation utilisees pour le criblage sont les suwantes 
la prehybndation est effectuee pendant 6 a 7 heures dans du 5XSSPE 0 25% 
poudre de la.t ecreme, 0.05% SDS (sodiutn dodecyl sulfate) a 42 "C 
Lhy bridation «.« dans cette meme solution, en presence des 4 
ol.gonucleot.des marques en 3' au ddATPa32 P , pendam 24 heures . ■ 
Au terme de ces 24 heures d' hybridation, les filtres sont laves tro is fois 
pendant 15 m.nutes dans du 2XSSC, 0.1% SDS puts mis en contact avec un 
film autoradiographic pendant 24 heures a -80°C. Les phages hybridant 
vec e groupe d' oligonucleotides ont ete purif.es par 2 tours supplemental 
de cr,b,age ("p.aque purification"). Une fois purify les s, cLs positifs 
ont ete testes avec chacun des oligonucleotides pris independamment Un 
Phage a reag. positivement avec les 4 oligonucleotides, il a ete traite de 
mamere. a "exciser ■ le plasmide Bluescr.pt recombinant en su.vant , 
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indications du fabricant (Stratagene). La carte de restriction de I* insert (codant 
pour la CCR) cpntenu dans ce plasmide est schematisee sur la figure 1 

IV Caracter isation et identification de 1'ADNc de in CCR 

La sequence en acides amines (representee par SEQ ID NO 6) deduite de 
la sequence nucleotidique (representee par SEQ ID NO 5) code pour une 
proteine de 335 acides amines dont le poids moleculaire est de 36,5 kD et le 
point isoelectrique d'environ 5,8. II est important de souligner que toutes les 
sequences peptidiques obtenues a partir de la CCR puriflee sont retrouvees 
dans la sequence peptidique deduite de la sequence nucleotidique de I'ADNc. 

Des recherches d' homologies avec des clones deja existants ont ete 
effectuees en utilisant les programmes BLAST et FASTA dans toutes les 
banques proteiques et nucleiques disponibles. Une homologie significative a 
ete trouvee avec une autre reductase du metabolisme des composes 
phenoliques, la dihydroflavonol reductase (DFR). L'identite est d'environ 
40% et la similarite proche de 20% entre la sequence peptidique deduite de 
I'ADNc de la CCR et les sequences des di verses dihydroflavonol reductase 
repertories dans les banques, ce qui confirme que le clone identifie est 
different d'un clone codant pour une DFR. 

V Production de CCR recomhinante active dans E Cnli 

Pour aller plus loin dans 1* identification de I'ADNc de la CCR, la 
proteine recombinante a ete produite dans E. Coli et son activite enzymatique 
a ete recherchee. Les details experimentaux de cette approche sont decrits ci- 
apres . 

1- Introduction de I'ADNc dans le vecteur d' expression pT7-7. 

Afin de pouvoir doner I'ADNc dans le vecteur d' expression pT7-7 
(disponible commercialement), sous le controle du promoteur de la 
T7 polymerase, nous avons du introduire un site Ndel a I'ATG de I'ADNc. 
Ceci a ete realise a l'aide d'une Taq polymerase lors d'une reaction 
d' amplification genique par PCR (Polymerase Chain reaction) entre un 
oligonucleotide mute et une amorce commerciale, T7, situe sur Bluescript en 
aval de 1'extremite 3* de I'ADNc. Le produit d' amplification obtenu est digere 
par Kpnl, ce site est ensuite repare a l'aide du fragment klenow de l'ADN 
polymerase I avant de soumettre le fragment a une digestion par Ndel, puis le 
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fragment obtenu comportant un site Nde. en 5' e, une extreme franche en 3' 
est .nseree a ,'aide dune ADN T4 .i gase dans Ie vecteur pT7 . ? J^^l 
ouvert par Ndel et Smal. prealablement 

apres ^ * V ° liSO ™^ «* susmen.ionne est indiquee ci- 

Les bases sou.ignees et en ita.iques ont ete modifies par rapport a la 
sequence mu.ale permettant la creation d'un site Ndei (CATATG) 
5 'GGCAATCCC<^ATGCCCGTCGACGC3 ' 

2. Surexpression de CCR dans E. Coli BL21 

U contraction ainsi obtenue est introduce dans la souche E. Coli BL21 
W»pcm,ble commerca.ement) qui porte sur son chr 0m oso m e ,e eene de la 
T Polymerase sous con.ro.e du promoteur ,ac UV5, promoteur inductib.e par 
1 IPTG. La culture recombinant est cultivee a 37°C jusqu a obtention d une 
DO m esuree de 1 a 600 nm, puis la production de la CCR ^ . 
« ajout d'lPTG (0.25% f ma .) dans le mUieu de cu.ture. Des preleve.ents soJ 
reahses a differents temps apres induction et les cellules sont lysees selon le 
protocole decrit par Grima-Pettenati et al. (1993). Apres cen.rifiiga.ion le 
surnageant contenant les pro.eines solubles, es. u.iHse pour m esurer Tactivite 
CCR « pour v.suahser la production de CCR apres elec.rophorese en 
ondn.ons denaturan.es. On note Tappari.ion d'un polypeptide d'environ 38 
™ dont I mtensitc crou avec le temps pos.-.nduction et qui n'exis.e pas dans 
les temoms negatifs (souche BL21 contenant seu.ement le vecteur P T7-7 sans 
•nsert). De plus, la preuve finale de Hdenute du clone CCR est apporte par la 
.esure d une activ.te CCR (environ 7 nKa, m , de culture apres 3h deduction 

T" 7 I An™" 115 Pr0t " qUeS Pr ° Venam ^ S ° UCheS BL21 —ant le 
PT7-7 + ADNc CCR, seulement. 

.a seau L en VeCteUr - d6n0rnni ' ">* " 2 >' C <™" 

la sequence representee par SEQ ID NO 5 clonee dans le vecteur Bluescript a 

ete depose en culture dans des cel.u.es de E. coli DH5a a la Collection 

Nattonale de Culture de Micro-organismes (CNCM) de I'lnstitut Pasteur a 

Pans (France), le 17 mars 1994 sous le n° 1-1405. 
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Legendes des figures: 

Figure 1: carte de restriction de I'ADNc codant pour la CCR 
d'eucalyptus. 

Figure 2: representation schematique du plasmide pEUCCR contenant la 
sequence representee par SEQ ID NO 5 (et identifiee par CCR dans le 
plasmide pEUCCR). 

Figure 3: representation schematique de la construction d un vecteur 
contenant une sequence d'ADN codant. pour la CCR d'eucalyptus selon 
1' invention (ou vecteur CCR sens). 

Figure 4: representation schematique de la construction d un vecteur 
contenant une sequence d'ADN codant pour un ARN antisens susceptible de 
s'hybrider avec l'ARNm codant pour la CCR d'eucalyptus selon 1' invention 
(ou vecteur CCR antisens). 

Concerriam 1'APN "source servant a la construction dun vecteur 

antisens (ou sens) 

L'ARN antisens derive preferentiellement de la sequence contenue dans 
le clone pEUCCR. Cette sequence peut etre obtenue de differentes manieres: 

1) en coupant avec des enzymes de restriction appropriees la sequence 
d'ADN (ADNc) de la CCR contenue dans pEUCCR, 

2) en realisant une amplification genique (PCR) a l'aide 
d'oligonucleotides definis de maniere a synthetiser le fragment d'ADN 
souhaite. 

Le fragment d'ADN. ainsi obtenu est clone dans un vecteur d'expression 
des plantes en aval d'un promoteur et en amont d'un terminateur. Le clonage 
est realise de telle fa^on que le fragment d'ADN est insere en orientation 
inverse par rapport au promoteur. Dans ce nouveau vecteur, le brin qui etait 
initialement le brin matrice devient le brin codant et vice versa. 

Le nouveau vecteur code pour un ARN dont la sequence est 
complementaire de la sequence de TARN messager deduit de la sequence 
contenue dans pEUCCR. 

Ainsi les 2 ARN sont complementaires de par leur sequence mais aussi 
de par leur orientation (5'-3 f ). 
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Comme source d'ADN pour la transcription de TARN anusens , est 
prauque d uuliser un clone d'ADNc tel que celui contenu dans pEUCCR. 

Exemple de clonap e griM^n * (cf. figure 4) 

L'ADNc de la CCR est obtenu par une doub.e digestion (BamHI et 
Kpnl) a partir du vecteur pEUCCR. Le fragment d'ADN ainsi libere est 
separe physiquement du vecteur de c.onage par une electrophone en ee . 
d Agarose (Bluescript). e 

La partie de gel renfermant ce fragment d'ADN est decoupee et traitee 
de facon a obtenir l'ADN purifie (plusieurs methodes peuvent etre utilise* 
dont la "Low melting Agarose", decrite dans Sambrook et al. susmention.e le 
Gene Clean, dont le kit est disponible commercialement). 

Le fragment portant les extremes BamHI et Kpnl est "l.eue" avec un 
vecteur depression de plantes prealablement digere par ces memes enzymes 
cho.s.es de facon a ce que le cDNA soit msere en or,entat,on inverse par 
rapport au promoteur 35 s . Le bnn qui S£ra transcrjt dans ^ ^ ^ 
ce cas le brin non codant. 

Exemole de clonagf ^ns ( c f. figure 3) 

Dans ce cas, il n'existe pas de sites de restriction "pratiques" pour 
reahser une fusion traductions! le avec le promoteur 35 s du vmeur 
d expression. De nouveaux sites plus commodes ont ete inseres a laide de la 
technique d'amplificat.on gemque (PGR). Deux olieonucleotides ont ete 
defin,s en 5' et 3' de TADNc auxquels ont ete ajoutees^es sequences des s.tes 
reconnus par Kpnl et BamHI (NB, ce sont les memes sites qui ont ete utilises 
pour le clonage ant.sens susmemionne, mais positionnes differemment par 
rapport a T orientation 5' -3'). 

^amplification genique conduit a Intention d'un fragment contenant la 
total.te de la sequence codante du cDNA flanquee de 2 sites de restriction La 
suite de la procedure est identique a celle decrite pour la construction anusens 

Ma.s, dans ce cas, on a realise une fusion du promoteur en phase avec 
1 ATG de la CCR qui doit conduire a une suppression de I'ARN messager et 
done de la proteine CCR. 

Les exemples de clonage des sequences sens et antisens decrits ci-dessus 
dans le cas de la CCR d euca.yptus. sont ega.ement applicab.es dans le cas de 
la CCR de luzerne et de celle de mais. 
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B) Obtention de I'ADNc codant pour la CCR de luzerne (Medicago 
truncatula). 

Caracteristiques de la banque d'ADNc : 
5 La banque utilisee a ete construite a partir d'ARN totaux extraits de 

racines de Medicago truncatula^ dans le vecteur A.ZAPH (kit "ZAP-cDNA 
synthesis" de Stratagene). 

Criblage de la banque d'ADNc : 
Sonde : 

io Le criblage de la banque de luzerne a ete effecrue a I'aide de I'ADNc 

codant pour la CCR d 'eucalyptus. Un fragment de 800 bp (Xho-Xho) de 
pEUCCR marque par la technique d'amorgage aleatoire a servi de sonde. 

Etalement de la banque et empreintes sur filtre de nitrocellulose : 
300 000 clones ont ete etales puis transferes sur filtre de nitrocellulose 
15 (Schleicher & Schuell), Pour cela, les {litres ont ete places 5 mn sur les boites 
de culture puis immerges successivement dans les solutions suivantes : 



1 .5M NaCl/0, 5M NaOH 5 mn 

1 ,5M NaCI/0, 5M Tris pH 8 5 mn 

20 3x SSC 2 mn 

cuisson 2 heures a 80°C. 



Prehybridation-hybridation : 

Les fiitres ont ete prehybrides pendant 12 heures, puis hybrides 
25 pendant 24 heures a 37 °C dans le milieu suivant : 

Milieu de prehybridation et d' hybridation : 
Formamide 20% 
Dextran 10% 
NaCl 1M 

30 ADN sperme de saumon (1 mg/ml) 

0,2% polyvinylpyrrolidone 
0,2% BSA 
0,2% ficoll 

0,05M Tris-HCl pH 7.5 
3 5 0,1% sodium pyrophosphate 

1% SDS. 
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Apres hybridation, les nitres on, etc laves 2x 10 mn a temperature 

;:tr dans du 2x ssc - i% sds ' - - 3 ° -» * «-c .ansT™:: 



Apres exposition amoradiographique des filtres. 15 p| aK s de Ivse 
pos.uves on, e,e idemifiees. Ces plages de lyse on, ete puriflee ' '7 2 1'f 

zr^ de cribiase ' dans * ■ -yLat:x r 2 ,,:r:r 

Excision in vivo : 

A partir des clones posi.ifs, le plasmide Bluescrip, du phage a ete 
excse se or , „ decision ft, du ■• 2AP . cDNA Syn ^ ^ 
L ADNc CCR de luzerne : 

L'ADNc codant pour la CCR de luzerne, d une taille de 1404 pbs est 
msere entre les sites EcoRl (cote 5"> er Yhn /.a,- 

1 e 5 ' et Xh0 (cote 3 ) du vecteur Bluescriot II 
est consume des parties suivantes : P 

- une partie 5' transcrite non traduite de 167 pbs 

- une region de 1028 pbs qui code pour une protetne de 342 acides 
amines , 

- une partie 3' transcrite non traduite de 209 pbs. 

L'ADNc obtenu est represent par SEQ ID NO 1. et la sequence en 
acmes armnes deduite de cet ADNc est represent* par SEQ ID NO 2 

C) Obtention de l'ADNc codant pour la CCR de maYs. 

Caracterisiinnes de i a h^ ni ne H' Ap pj^ 

racne^d ban w UtUiS " " * ^ d ' ARN t0taux -traits de 

acnnes de mats (var.ete AMO 406) carence en fer. dans le vecteur >.ZAP (kit 
ZAP-cDNA synthesis" de Stratagene). ( 
Criblage de la hanq,, f hapnf 
Sonde : 

CCR ^ r ib,age ^ 13 b3nqUe ^ ma,S 3 eff6CrU<§ 4 raide * '"ADNc 

paMa te c r Z' * "» * " EUCCR -que 

par la technique d'amorcage aleatoire a servi de sonde. 

Etalement de la banque et empreintes sur filtre de nitrocellulose • 

rsrhi • H 500 ,^ 0 Cl ° neS ° m ' tal6S PUiS tranSf6n§S SUr fiItre de nitrocellulose 
(Sch.e.cher & SchueU). Pour cela, ,es filtres ont ete place, 5 mn sur les boites 

de culture puts tmmerges successivement dans l es solutions suivantes 
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J,5M NaCI/O, 5M NaOH 
1,5M NaCI/O, 5M Tris pH 8 

3x SSC 



2 mn 



5 mn 



5 mn 



10 



15 



20 



cuisson 2 heures a 80°C. 
Prehybridation-hybridation ; 

Les filtres ont ete prehybrides pendant 12 heures, puis hybrides 
pendant 24 heures a 55 °C dans le milieu suivant : 



Milieu de prehybridation et d'hybridation : 

3x SSC 

0,5% SDS 

0, 1 % lait en poudre 

ADN sperme de saumon (1 mg/ml). 



Apres hybridation, les filtres ont ete laves 2x 10 mn a temperature 
ambiante dans du 3x SSC-0,5% SDS, puis 2x 45 mn a 60°C dans la meme 
solution. 

Apres exposition autoradiographique des filtres. 20 plages de lyse 
positives ont ete identifiees. Ces plages de lyse ont ete purifiees par 3 cycles 
supplementaires de criblage, dans les conditions d' hybridation decrites ci- 
dessus. 

Excision in vivo : 

A partir des clones positifs, le plasmide Bluescript du phage h a ete ' 
excise selon le protocole d'excision in vivo du "ZAP-cDNA Synthesis kit". 

L'ADNc obtenu est represente par SEQ ID NO 3. et la sequence en 
acides amines deduite de cet ADNc est represente par SEQ ID NO 4. 
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LISTE DE SEQUENCES 

(1) INFORMATION GENERATE: 
(i) DEPOSANT: 

(A, NOM: CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIC^ 

(B) RUE: 3, rue Michel-Ange 
(C> VILLE: PARIS 75016 
'(E) PAYS: FRANCE 
(F) CODE POSTAL: F- 75016 

(ii) TITRE OE L ' INVENTION : SEQUENCES D-ADN CODANT POUR LA CINNAMOYL 
COA REDUCTASE, ET SES APPLICATIONS DANS LE 
DOMAINE DE LA REGULATION DU TAUX DE LIGNINE CHEZ LES 
PLANTES 

(iii) NOMBRE DE SEQUENCES: 14 

(iv) FORME LISIBLE PAR ORDINATEUR : 

(A) TYPE DE SUPPORT : Floppy disk- 

(B) ORDINATEUR: IBM PC compatible' 

(O SYSTEME D- EXPLOITATION : PC -DOS /MS - DOS 

(D) LOGICIEL: Patentln Release Sl „ „ ■ 

Ke±ease #1.0, Version U1.25 (OEB) 

(2) INFORMATION POUR LA SEQ ID HO: 1; 

(ir CARACTER I S T I QUE S DE LA SEQUENCE • 

(A) LONGUEUR: 1568 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(iij TYPE DE MOLECULE: ADNc pour ARNm 

(ix) CARACTER I S T I QUE ADDITIONELLE • 

(A) NOM/CLE: CDS ' ' " 

(B) EMPLACEMENT: 278.. 1306 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 1 : 
CATGATTACG CCAAGCTCGA AATTAACCCT CACTAAAGGG AACAAAAGCT GGAGCTCCAC 
CGCGGTCGCG GCCGCTCTAG AACTAGTGGA TCCCCCGGGC TGCAGGAATT CGGCACGACG 12c 
GGATAGAGAA GAAAGGTGGT CATATTTCCC . ACTTATTATT ACAAAGTAAC GTCACACCAA 18c 
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CTTTATCACC ACCTTTCTTC TCTATCCCAT TCATTCTCAT TCATTCATTC ACCTCACCTC 24 0 

ACCTCACCTC ACCTCCCTTT ACAAGAAGAA GGAATAT ATG CCT GCC GCT ACC GCC 2 95 

Met Pro Ala Ala Thr Ala 
1 5 

GCC GCC GCC GCC GAA TCT TCC TCA GTT TCC GGC GAA ACC ATA TGT GTC 343 
Ala Ala Ala Ala Glu Ser Ser Ser Val Ser Gly Glu Thr lie Cys Val 
10 15 20 

ACC GGG GCC GGT GGC CTC ATC GCT TCT TGG ATG GTT AAG CTC CTC TTG 391 
Thr Gly Ala Gly Gly Leu He Ala Ser Trp Met Val Lys Leu Leu Leu 
25 30 35 



GAG AAA GGC TAT ACC GTT CGA GGA ACC TTG CGA AAC CCA GAT GAT CCA 
Glu Lys Gly Tyr Thr Val Arg Gly Thr Leu Arg Asn Pro Asp Asp Pro 
4 ° 45 50 



439 



AAA AAT GGG CAC TTG AAA AAG TTG GAA GGA GCA AAA GAA AGG CTA ACT 4 87 

Lys Asn Gly His Leu Lys Lys Leu Glu Gly Ala Lys Glu Arg Leu Thr 
55 60 65 70 

TTG GTC AAA GTT GAT CTC CTT GAT CTT AAC TCC GTT AAA GAA GCT GTT 535 
Leu Val Lys Val Asp Leu Leu Asp Leu Asn Ser Val Lys Glu Ala Val 
7 5 80 85 

AAT GGA TGT CAT GGT GTC TTT CAC ACT GCT TCT CCC GTT ACA GAT AAC 58 3 

Asn Gly Cys His Gly Val Phe His Thr Ala Ser Pro Val Thr Asp Asn 
90 95 100 

CCC GAG GAA ATG GTG GAG CCA GCA GTG AAT GGA GCA AAG AAT GTG ATC 631 
Pro Glu Glu Met Val Glu Pro Ala Val Asn Gly Ala Lys Asn Val He 
105 110 115 

ATA GCT GGT GCA GAA GCA AAA GTG AGG CGC GTG GTT TTC ACA TCA TCA 6 79 

He Ala Gly Ala Glu Ala Lys Val Arg Arg Val Val Phe Thr Ser Ser 
120 125 130 

ATT GGT GCA GTC TAT ATG GAC CCC AAT AGG AGT GTT GAT GTA GAG GTT 72 7 

He Gly Ala Val Tyr Met Asp Pro Asn Arg Ser Val Asp Val Glu Val 
135 140 145 150 

GAT GAG TCT TGC TGG AGT GAT TTG GAG TTT TGC AAG AAA ACC AAG AAT 775 
Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe Cys Lys Lys Thr Lys Asn 
155 160 165 

TGG TAT TGC TAT GGG AAA GCA GTG GCA GAA GCA GCA GCA TGG GAT GTA 82 3 

Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu Ala Ala Ala Trp Asp Val 
170 175 180 

GCA AAA GAG AAA GGT GTG GAT TTG GTT GTA GTG AAT CCA GTT TTG GTT 8 71 

Ala Lys Glu Lys Gly Val Asp Leu Val Val Val Asn Pro Val Leu Val 
185 190 195 

CTT GGA CCA TTG CTA CAA CCT ACA ATC AAT GCA AGC ACA ATT CAC ATA 919 
Leu Gly Pro Leu Leu Gin Pro Thr lie Asn Ala Ser Thr He His He 
200 205 210 
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CTA AAA TAC CTA ACT GGT TCA GCT AAG ACC TAT GCA AAT »™ 

Leu Lys Tyr Leu Thr rl„ c= T CA ^ T GCA ACA CAA 

215 Ala LyS Thr ^ Asn Ala Thr Gin 

220 225 230 



GCT TAT GTT CAT GTT AGG GAT GTT GCA TTA GCT CAC a™ ^ 

«. ^V,, Hi. V.J „ p w Ala ™ £ ™ ™ Leu ST Tyr 

245 

GAG AAA CCT.TCT GCT TCT ■ GGT AGA TAC TTA TGT CrT rn, 

«a ^ S.r Ala s.r Gly Arg Tyr ^ ™ £7 « T« CTT 

255 260 
CAT CGT GGG GAG CTT GTT GAA ATT CTT rr- n*^ ™ 

H*. ^ «v — , V„ „„ S S £ £ £ £ £ £u Tyr 



270 2 



285 290 



CAT ATC TTC TCA AAT AAA AAA CTG AAG GAT TTG GGA TTG - > TT~ ir, 
His He Phe Ser Asn Lys Lys Leu Lys Asp Leu Gly ™ oT. llL J£ 



305 



310 



CCA GTG ACT GAA TGT TTA TAT GAA ACC GTT AAG AGC CTA CAA GAC CAA 
Pro val Ser Glu Cys Leu Tyr Glu Thr Val Lys Ser ,eu G^ tf P Tn 



320 325 



GGT CAC CTT TCT ATT CCA AAC AAA GAA GAT TCT CTA GCA GTC AAA TCC 
Gly Hxs Leu Ser He Pro Asn Lys Glu Asp Ser Leu Ala vI7 L^ Ser 
330 335 340 

TAAACCAACC ATCCTTTGTT AACAAGTTCA ATTCAGGGCC AAAAAGAATC ATCTTTTAGC 
TACCTGCGAG GCTTTAGGCT CTAGCAATTT GATACTATAA ATGACCGTAA . TTGGATGGAT 
AGTTGTAAGA AAGTATCATG CTAGAATTTA CTATTTGTCT TTATGTTTGA AAAATAAGCC 
CATTATATTA AAAAAAAAAA AAAAAAAAAA AACTCGAGGG GGGGCCCGGT ACCCAATTCG 
CCCTATAGTG AGTCGTATTA CAATT 

(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE • 

(A) LONGUEUR: 342 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 
■ Ui> DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2: 
Met Pro Ala Ala Thr Ala Ala Ala Ala Ala Glu Ser Ser Ser Val ger 



967 
1015 
1063 
1111 
1159 
1207 
1255 
1303 

1363 
1423 
1483 
1543 
1568 



5 10 15 
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Gly Glu Thr lie 
20 

Met Val Lys Leu 
35 

Arg Asn Pro Asp 
50 

Ala Lys Glu Arg 
65 

Ser Val Lys Glu 



Ser Pro Val Thr 
100 

Gly Ala Lys Asn 
115 

Val Val Phe Thr 
130 

Ser Val Asp Val 
145 

Cys Lys Lys Thr 



Ala Ala Ala Trp 
180 

Val Asn Pro Val 
195 

Ala Ser Thr lie 
210 

Tyr Ala Asn Ala 
225 

Ala His lie Leu 



Cys Ala Glu Thr 
260 

Lys Tyr Phe Pro 
275 



Asn Pro Arg Val 
290 

Leu Gly Leu Glu 
305 



Cys Val Thr Gly 



Leu Leu Glu Lys 
40 

Asp Pro Lys Asn 
55 

Leu Thr Leu Val 

70 

Ala Val Asn Gly 
85 

Asp Asn Pro Glu 



Val lie He Ala 

120 

Ser Ser He Gly 
135 

Glu Val Asp Glu 
150 

Lys Asn Trp Tyr 
165 

Asp Val Ala Lys 



Leu Val Leu Gly 
200 

His He Leu Lys 
215 

Thr Gin Ala Tyr 
230 

Val Tyr Glu Lys 
245 

Ser Leu His Arg 



Glu Tyr Pro He 
280 



Lys Pro His He 
295 

Phe Thr Pro Val 
310 
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Ala Gly Gly Leu 
25 

Gly Tyr Thr Val 



Gly His Leu Lys 
60 

Lys Val Asp Leu 
75 

Cys His Gly Val 
90 

Glu Met Val Glu 
105 

Gly Ala Glu Ala 



Ala Val Tyr Met 
140 

Ser Cys Trp Ser 
155 

Cys Tyr Gly Lys 
170 

Glu Lys Gly Val 
185 

Pro Leu Leu Gin 



Tyr Leu Thr Gly 
220 

Val His Val Arg 
235 

Pro Ser Ala Ser 
250 

Gly Glu Leu Val 
265 

Pro Thr Lys Cys 



Phe Ser Asn Lys 
300 

Ser Glu Cys Leu 
315 



He Ala Ser Trp 
30 

Arg Gly Thr Leu 
45 

Lys Leu Glu Gly 



Leu Asp Leu Asn 
80 

Phe His Thr Ala 

95 

Pro Ala Val Asn 
110 

Lys Va 1 Arg Arg 
125 

Asp Pro Asn Arg 



Asp Leu Glu Phe 
160 

Ala Val Ala Glu 
175 

Asp Leu Val Val 
190 

Pro Thr He Asn 
205 

Ser Ala Lys Thr 



Asp- Val Ala Leu 
240 

Gly Arg Tyr Leu 
255 

Glu He Leu Ala 
270 

Ser Asp Glu Lys 
285 



Lys Leu Lys ' Asp 



Tyr Glu Thr Val 
320 



BNSOOCID: <WO 9712982A1J_> 



WO 97/12982 _ 

PCT/FR96/01544 

^ ser Leu ala ^ Gln Gly Hig Leu --; l ^ a ^ 



330 335 



Ser Leu Ala Val -Lys Ser 
340 



(2) INFORMATION POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIOUES DE LA SEQUENCE ■ 

(A) . LONGUEUR : 1556 paxres de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

. (ii). TYPE DE MOLECULE: ADNc pour ARNm 

(ix) . CARACTERISTIQUE ADDITIONELLE • 

(A) NOM/CLE: CDS ' 

(B) EMPLACEMENT: 195..13i 0 

<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 
GTTCCCATGA TTACCCCAAG CTCGAAATTA ACCCTCACTA AAGGGAACAA AAGCTGGAGC 
TCCACCGCGG TGGCGGCCGC TCTAGAACTA GTGGATCCCC CGGGCTGCAG GAATTCGGCA 
CGAGAGGACA CAAGCGAGCG CTAGCCAGAA GAGCAGCTGC AGGTACTATT ATCATCGTCG 

Met Thr val Val Asp Ala Val Val ^ ™ Asp 



5 10 



s s s s s s s ss s s s s s e ? t 

- S S ~ S S 5 » S « £ «C « TCG „ 

40 

GTG AAG CTG CTG CTC GAG AAG GGA TAC ACT rrr 

Val Lys Leu Leu Leu Glu Lys Gly Jyr tS vll T 2?° ^ ° TG AGG 
45 50 yS Gly Thr Val Arg 

55 60 
AAC CCA GAT GAC CCG AAG AAC GCG CAC CTC & rp 

- ,„ Asp Asp p „ Lye fls „ Ma - °* J» SCO ™ S C COC OCC 

S £■ S 2 £ « ~ - s S 2 S £ £ ~ E 



6C 
12G 
18C 
230 

278 

326 

374 

422 

47C 

516 



100 105 
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CCC GTC ACC GAC GAC CCG GAG CAA ATG GTG GAG CCG GCG GTG CGC GGC 56 6 

Pro Val Thr Asp Asp Pro Glu Gin Met Val Glu Pro Ala Val Arg Gly 
110 115 120 

ACC GAG TAC GTG ATC AAC GCG GCG GCG GAG GCC GGC ACG GTG CGG CGG 6 14 

Thr Glu Tyr Val He Asn Ala Ala Ala Glu Ala Gly Thr Val Arg Arg 
125 130 135 140 

GTG GTG TTC ACG TCG TCC ATC GGC GCC GTG ACC ATG GAC CCC AAG CGC 66^ 
Val Val Phe Thr Ser Ser He Gly Ala Val Thr Met Asp Pro Lys Arg 
145 150 155 

GGG CCC GAC GTC GTG GTC GAC GAG TCG TGC TGG AGC GAC CTC GAG TTC 710 
Gly Pro Asp Val Val Val Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe 
160 * 165 170 

TGC GAG AAA ACC AGG AAC TGG TAC TGC TAC GGC AAG GCG GTG GCG GAG 7 58 

Cys Glu Lys Thr Arg Asn Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu 
175 180 185 



CAG GCG GCG TGG GAG GCG GCC CGG CGG CGG GGC GTG GAC CTG GTG GTG 
Gin Ala Ala Trp Glu Ala Ala Arg Arg Arg Gly Val Asp Leu Val Val 
190 195 200 



806 



GTG AAC CCC GTG CTG GTG GTG GGC CCC CTG CTG CAG GCG ACG GTG AAC 8 54 

Val Asn Pro Val Leu Val Val Gly Pro Leu Leu Gin Ala Thr Val Asn 
205 210 215 220 

GCC AGC ATC GCG CAC ATC CTC AAG TAC CTG GAC GGC TCG GCC CGC ACC 902 
Ala Ser He Ala His He Leu Lys Tyr Leu Asp Gly Ser Ala Arg Thr 
225 230 235 

TTC GCC AAC GCC GTG CAG GCG TAC GTG GAC GTG CGC GAC GTG GCC GAC 9 50 

Phe Ala Asn Ala Val Gin Ala Tyr Val Asp Val Arg Asp Val Ala Asp 
240 245 . 250 

GCG CAC CTC CGC GTC TTC GAG AGC CCC CGC GCG TCC GGC CGC CAC CTC 9 98 

Ala His Leu Arg Val Phe Glu Ser Pro Arg Ala Ser Gly Arg His Leu 
25 5 260 265 

TGC GCC GAG CGC GTC CTC CAC CGC GAG GAC GTC GTC CGC ATC CTC GCC 104 6 

Cys Ala Glu Arg Val Leu His Arg Glu Asp Val Val Arg He Leu Ala 
27 ° 275 280 

AAG CTC TTC CCC GAG TAC CCC GTC CCA GCC AGG TGC TCC GAC GAG GTG 10 94 

Lys Leu Phe Pro Glu Tyr Pro Val Pro Ala Arg Cys Ser Asp Glu Val 
285 290 295 300 

AAT CCG CGG AAG CAG CCG TAC AAG TTC TCC AAC CAG AAG CTC CGG GAC 114 2 

Asn Pro Arg Lys Gin Pro Tyr Lys Phe Ser. Asn Gin Lys Leu Arg Asp 
305 310 315 

CTG GGG CTG CAG TTC CGG CCG GTC AGC CAG TCG CTT TAC GAC ACG GTG 1190 
Leu Gly Leu Gin Phe Arg Pro Val Ser Gin Ser Leu Tyr Asd Thr Val 
320 325 330 
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"s lIu Tu r ^ CTG " C4?G CTC GGA ™ 

Leu Gin Glu Lys Gly HlS Leu Pro Val Leu Gly Glu Arg Thr 

340 345 



™ ™ ss s, c s £ r ?r «« «° ™ <=» - 

350 P 7 P Ala Pr ° Ala Ala Glu Met Gin Gin 



355 360 



Ty S S ™ £ S TOMM00O ° ™™ 

36 5 370 

AGCAATGTTC ATACTGCTGC CCTGCACCTG CACCTTCCCC TGCTGTGTAA ACAGGCCTGT 
GTTTGTTCTG GCTGATAGTG ATGTACCCTA AGACTTGTAA CGTCATGTTC GTTCTTGTGA 
ACTATAGCGA GTGAATAAAA TTGGTTAATG TTGGATAATT CCAAAAAAAA AAAAAAAAAA 
CTCGAGGGGG GGCCCGGTAC CCAATTCGCC CTATAGTGA 

<2) INFORMATION POUR LA SEQ ID NO : 4; 

(i> CARACTERISTIQUES DE LA SEQUENCE - 

(A) LONGUEUR: 371 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 
"I Ala ^1 Val Ser Ser Thr Asp Ala Gly Ala Pro 

Ala Ala Ala Ala Ala Pro Val Pro Ala Gly Asn Gly Gin Thr Val Cys 

2S 30 
Val Thr Gly Ala Ala Gly Tyr He Ala Ser Trp Leu Val Lys Leu Leu 

HV 45 

Leu Glu Lys Gly Tyr Thr Val Lys Gly Thr Val Ar g Asn Pro Asp Asp ' 

55 60 

Pro Lys Asn Ala His Leu Arg Ala Leu Asp Gly Ala Ala Glu Arg Leu 

° 75 80 

He Leu cys Lys Ala Asp Leu Leu Asp Tyr Asp Ala He Cys Arg Ala 
Val Gin Gly cys Gin Gly Val Phe His Thr Ala Ser Pro Val Thr Asp 

J- U U 1 AC, 

XUb 110 
Asp Pro Glu Gin Met Val Glu Pro Ala Val Arg Gly Thr Glu Tyr Val 

125 

He Asn Ala Ala Ala Glu Ala Gly Thr Val Arg Arg Val Val Phe Thr 

135 140 



1238 



1286 

1337 

1397 
1457 
1517 
1556 
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^er ser lie Gly Ala Val Thr Met Asp Pro Lys Arg Gly Pro Asp Val 
145 , 150 155 leo 

Val Val Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe Cys Glu Lys Thr 
165 170 175 

Arg Asn Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu Gin Ala Ala Trp 
180 185 190 

Glu Ala Ala Arg Arg Arg Gly Val Asp Leu Val Val Val Asn Pro Val 

195 200 205 



Leu Va 1 Val Gly 
210 

His lie Leu Lys 
225 

Val Gin Ala Tyr 



Val Phe Glu Ser 
260 

Val Leu His Arg 
275 

Glu Tyr Pro Val 
290 

Gin Pro Tyr Lys 
305 

Phe Arg Pro Val 



Glu Lys Gly His 
340 

Ala Asp Lys Asp 
355 

He Arg Ala 
370 



Pro Leu Leu Gin 
215 

Tyr Leu Asp Gly 
230 

Val Asp Val Arg 
245 

Pro Arg Ala Ser 



Glu Asp Val Val 
280 

Pro Ala Arg Cys 
295 

Phe Ser Asn Gin 
310 

Ser Gin Ser Leu 
325 

Leu Pro Val Leu 



Ala Pro Ala Ala 
3 6 0- 



Ala Thr Val Asn 

220 

Ser Ala Arg Thr 
235 

Asp Val Ala Asp 
250 

Gly Arg His Leu 
265 

Arg He Leu Ala 



Ser Asp Glu Val 
300 

Lys Leu Arg Asp 
315 

Tyr Asp Thr Val 
33 0 

Gly Glu Arg Thr 
345 

Glu Met Gin Gin 



Ala Ser He Ala 



Phe Ala Asn Ala 
240 

Ala His Leu Arg 
255 

Cys Ala Glu Arg 
270 

Lys Leu Phe Pro 
285 

Asn Pro Arg Lys 



Leu Gly Leu Gin 
320 

Lys Asn Leu Gin 
335 

Thr Thr Glu Ala 

350 

Gly Gly He Ala 
365 



(2) INFORMATION POUR LA SEQ ID NO : 5: 

(i) CA-RACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 97 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 
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(") TYPE DE MOLECULE: ADNc pour ARNm 

(1X) CARACTER I S T I QUE ADDITIONELLE : 
(A) NOM/CLE: CDS 
■(B) EMPLACEMENT: 136..1140 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 



PGT/FR96/01544 



MramC " ramf m ™» — «TC ACCATGTTAC ACAACATCTC 
CGGCTAAAAA AAAAGCGCAA CCTCCACCTC CTGAACCCCT CTCCCCCCTC 

««t Pro Val Asp Sla teu pro G , y o , y =ir _ t ^ 



1 . 5 



CTC TOO GTC ACC GGC GCC GGC GOG TTC ATC GCC TCC TGG ATT GTC AAG 

IS 

20 

U 25 
CTT CTC CTC GAG CGA GGC TAG ACC GTG CGA GGA ACC GTC AGG AAG CCA 

AGO CTG ACG CTG TAG AAG GGT GAT CTG ATG GAC TAG GGG AGC TTG GAA 
L* U THr L « u Tyt LyS „„ Asp'Leu H« Asp T yr Gly S.r L . u alu 



65 70 

7 3 



80 

ACC GAC GAT CCT GAG CAA ATG GTG GAG CCA GCG GTG ATC GGG ACG AAA 

Thr Asp Asp Pro Glu Gin Met Val Gl u Pro Al*v^ n ^ n 

■^u t-ro Ala Val He Gly Thr Lys 

95 100 105 



60 



120 



21S 



. 26' 



315 



363 



411 



4 59 
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AAT GTG ATC GTC GCA GCG GCG GAG GCC AAG GTC CGG CGG GTT GTG TTC 

Asn Val He Val Ala- Ala Ala Glu Ala Lys Val Arg Arg val Val Phe 
110 H5 120 

ACC TCC TCC ATC GGT GCA GTC ACC ATG GAC CCC AAC CGG GCA GAC GTT 555 

Thr Ser Ser He Gly Ala Val Thr Met Asp Pro Asn Arg Ala Asp Val 
125 130 . 135 140 



603 



651 



GTG GTG GAC GAG TCT TGT TGG AGC GAC CTC GAA TTT TGC AAG AGC ACT 
Val Val Asp Glu Ser Cys Trp Ser Asp Leu Glu Phe Cys Lys Ser Thr 
145 150 155 

AAG AAC TGG TAT TGC TAC GGC AAG GCA GTG GCG GAG AAG GCC GCT TGG 
Lys Asn Trp Tyr Cys Tyr Gly Lys Ala Val Ala Glu Lys Ala. Ala Trp 
160 165 i7o 

CCA GAG GGC AAG GAG AGA GGG GTT GAC CTC GTG GTG ATT AAC CCT GTG 6 95 

Pro Glu Gly Lys Glu Arg Gly Val Asp Leu Val Val He Asn Pro Val 
175 180 185 



747 



795 



843 



CTC GTG CTT GGA CCG CTC CTT CAG TCG ACG ATC AAT GCG AGC ATC ATC 
Leu Val Leu Gly Pro Leu Leu Gin Ser Thr He Asn Ala Ser He He 
190 195 200 

CAC ATC .CTC AAG TAC TTG ACT GGC TCA GCC AAG ACC TAC GCC AAC TCG 
His He Leu Lys Tyr Leu Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ser 

205. 210 -lie 

■ d± v 215 220 

GTC CAG GCG TAC GTG CAC GTC AAG GAC GTC GCG CTT GCC CAC GTC CTT 
Val Gin Ala Tyr Val His Val Lys Asp Val Ala Leu Ala His Val Leu 
225 230 235 

GTC TTG GAG ACC CCA TCC GCC TCA GGC CGC TAT TTG TGC GCC GAG AGC 891 
Val Leu Glu Thr Pro Ser Ala Ser Gly Arg Tyr Leu Cys Ala Glu Ser 
240 245 250 

GTC CTC CAC CGT GGC GAT GTG GTG GAA ATC CTT GCC AAG TTC TTC CCT 93 9 

Val Leu His Arg Gly Asp Val Val Glu He Leu Ala Lys Phe Phe Pro 
255 260 265 
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« T„ m m CCG ACC UG gm GTG AAC CCA ACA m 

^ b 280 

*» CC. TAC AAG XTC Tcc Mc „ G ^ AQft GAC TTe OGG 

,S ,„ Tyr Lys phe ,„ „„ G1 „ _ l ^ ^ ^ ^ ,03S 

^ Hb 290 

2 9 R 

yb 300 



3X0 • 

CAG «A GGC CAC CTA CCA CTC CCC TCC CCG CCC GAA GAT TCG GTG CG x 
L> ' S G1V Pr ° Val *™ Ser Pro Pro G1U . ASD Sgr yal _ 

320 325 

" S 330 

ATT CAG GGA TGATCTTAGA TCCATCACGG TGCGCATTTG TAATCCGGAG 
He Gin Gly 

3 3 S ' ' 



(2) INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 335 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

<*i> DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 6: 
Met Pro val Asp Ala Leu Pro Gly Ser Gly Gin 



Thr Val Cys Val Thr 
10 15 



1083 



1131 



1180 



~ " CMO, « 8 """™ ™— a agtcaaacct GGflGfiTacc , i24o 

ACCCTGAGTT CTGCATTGGA ATGGAAGTTG TCAATTGTTC CAAAAAAAAA AAAAAAA 



1297 
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Gly Ala Gly Gly Phe lie Ala Ser Trp lie Val Lys Leu Leu Leu Glu 
20 25 30 

Arg Gly Tyr Thr Val Arg Gly Thr Val Arg Asn Pro Asp Asp Pro Lys 
35 40 45 

Asn Gly His Leu Arg Asp Leu Glu Gly Ala Ser Glu Arg Leu Thr Leu 
50 55 60 



Tyr Lys Gly Asp 
65 

Gly Cys Asp Gly 

Glu Gin Met Val 
100 

Ala Ala Ala Glu 
115 

Gly Ala Val Thr 
130 

Ser Cys Trp Ser 
145 

Cys Tyr Gly Lys 

Glu Arg Gly Val 
180 

Pro Leu Leu Gin 
195 

Tyr Leu Thr Gly 
210 



Leu Met Asp Tyr 
70 

Val Val His Thr 
85 

Glu Pro Ala Val 

Ala Lys Val Arg 
120 

Met Asp Pro Asn 
135 

Asp Leu Glu Phe 
150 

Ala Val Ala Glu 
165 

Asp Leu Val Val' 

Ser Thr lie Asn 
200 

Ser Ala Lys Thr 
215 



Gly Ser Leu 
75 

Ala Ser Pro 
90 

lie Gly Thr 
105 

Arg Val Val Phe 

Arg Ala Asp Val 
140 

Cys Lys Ser Thr 
155 

Lys Ala Ala Trp 
170 

lie Asn Pro Val 
185 

Ala Ser lie lie 

Tyr Ala Asn Ser 
220 



Glu Glu Ala lie Lys 
80 

Val Thr Asp Asp Pro 

9 5 

Lys Asn Val lie Val 
110 

Thr Ser Ser lie 
125 

Val Val Asp Glu 

Lys Asn Trp Tyr 
160 

Pro Glu Gly Lys 
175 

Leu Val Leu Gly 
190 

His lie Leu Lys 
205 

Val Gin Ala Tyr 
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val His v.i Lys Asp val Ala Leu ftla val Leuvai ^ ^ 

230 

Pro Ser A1 a ser-Gly Ar g Tyr . Leu Cys Ala Qlu Ser ^ ^ ^ 

245 



Gly Asp Vai val Glu He Leu Ala Lys Phe Phe 



Pro Glu Tyr Asn Val 



260 

7 7 ^ 

280 285 

2 90 

300 

. ib 320 

325 



12) INFORMATION POUR LA SEQ ID NO: 7: 

<i> CARACTER I S T I QUE S DE LA SEQUENCE : 
(A) LONGUEUR : i 3 7 6 paires de ba S 
<B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 



(li) TYPE DE MOLECULE: ADNc 



pour ARNm 



(IX)- CARACTER I ST I QUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 99.. 11 12 



(X1) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 7: 
GAAAACACAC CTCCTCTCTT CTTTGTCTCT GTCTGT.TCTC CACTTTCCCA GTCACCAAAC 



6: 



WO 97/12982 PCT/FR96/01544 
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TCGTATGCAT ATAATTACAT TTATCTAAAT ATAACAAC ATG CCT GTT GAT GCT 113 

. Met Pro Val Asp Ala 

1 5 

TCA TCA CTT TCA GGC CAA GGC CAA ACT ATC TGT GTC ACC GGG GGT GGT 161 
Ser Ser Leu Ser Gly Gin Gly Gin Thr He Cys Val Thr Gly Glv'Gly 
10 15 2 0 

GGT TTC ATT GCT TCT TGG ATG GTT AAA CTT CTT TTA GAT AAA GGT TAC 2 09 

Gly Phe He Ala Ser Trp Met Val Lys Leu Leu Leu Asp Lys Glv Tvr 
25 30 35 

ACT GTT AGA GGA ACT GCG AGG AAC CCA GCT GAT CCC AAG A AT TCT CAT 2 57 

Thr Val Arg Gly Thr Ala Arg Asn Pro Ala Asp Pro Lys ■ Asn Ser His 
40 45 50 

TTG AGG GAG CTT GAA ' GGA GCT GAA GAA AGA TTA ACT TTA TGC AAA GCT 3 05 

Leu Arg Glu Leu Glu Gly Ala Glu Glu Arg Leu Thr Leu Cys Lys Ala 
55 60 65 

GAT CTT CTT GAT TAT GAG TCT CTT AAA GAG GGT ATT CAA GGG TGT GAT 3 53 

Asp Leu Leu Asp Tyr Glu Ser Leu Lys Glu Gly He Gin Gly Cys Asp 
70 75 80 85 

GGT GTT TTC CAC ACT GCT TCT CCT GTC ACA GAT GAT CCG GAA GAA ATG 4 01 

Gly Val Phe His Thr Ala Ser Pro Val Thr Asp Asp Pro Glu Glu Met 
90 95 ioo 

GTG GAG CCA GCA GTG AAC GGG ACC AAA AAT GTG ATA ATT GCG GCG GCT 449 
Val Glu Pro Ala Val Asn Gly Thr Lys Asn Val He He Ala Ala Ala 
105 110 H5 

GAG GCC AAA GTC CGA CGA GTG GTG TTC ACG TCA TCA ATT GGC GCT GTG 4 97 

Glu Ala Lys Val Arg Arg Val Val Phe Thr Ser Ser lie -Gly Ala Val 
120 .125 130 

TAC ATG GAT CCC AAT AAG GGC CCA GAT GTT GTC ATT . GAT GAG TCT TGC 54 5 

Tyr Met Asp Pro Asn Lys Gly Pro Asp Val Val He Asp Glu Ser Cys 
135 140 145 
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280 _ 285 



290 



593 



641 



.689 



165 

CGA AAG GCT GTG GCA GAA CAA OCT GCA TGG GAT ATG GCT AAG GAG AAA 

180 

185 190 

^ Asn Ala ser lie Thr His Ile Leu Lvs Tyi - ^ u 

200 2Q5 

Ub 210 

Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ser Val Gin Ala Tyr Val His 

215 

Val Arg Asp Val Ala Leu Ala His He Leu Val Pne Glu Thr Pro Sex- 

GTG GTG GAA ATC CTT GCA AAG TTC TTC COT GAG TAC CCC ATC OCT ACC 

265 270 . 275 

AAG TGC TCA GAT GAG AAG AAC CCA AGA AAA CAA CCT TAC AAG TTC TO 
^ S Cys ser Asp Glu Lys Asn Pro Arg Lys Gin Pro Tyr Lys Phe Ser 



833 



881 



929 



97: 



Asn Gin Lys Leu Arg Asp Leu Gly Phe Glu phe Thr prQ ^ ^ ^ 



29 5 300 



305 
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TGT CTG TAT GAA ACT GTT AAG AGT TTG CAG GAA AAG GGT CAC CTT CCA 10 73 

Cys Leu Tyr Glu Thr Val Lys Ser Leu Gin Glu Lys Gly His Leu Pro 
310 315 320 325 



1122 



ATC CCA AAA CAA GCT GCA GAA GAG TCT TTG AAA ATT CAA TAAGGCCTCT 
He Pro Lys Gin Ala Ala Glu Glu Ser Leu Lys He Gin 
330 335 



TGGAACTATT TATTAGGATT GTTCCATACC CCAAGTTTGG ATCGCAAATG CTAGGGAAAG 118 2 

GAGCATATTA AAGAATGCCA ATGTGCAGGT GTTTTAGTAT TTTACATGAA GAACTCTGAT 1242 

TATCCTTGTG CTTATAATAA TTTTTTTCAA GTGAGTGTCT TCAAATGTTC AACTTGTATT 13 02 

TGTGGTTGTC TAACTTTATC CAGTTTCAAT ATAAAAGAGG AACGATTCTA TGTCTTAAAA 1362 

AAAAAAAAAA AAAA 13?6 



(2) INFORMATION POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 3 38 acides amines 
<B) TYPE: acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 8: 



Met Pro Val Asp Ala Ser Ser Leu 
1 5 

Val Thr Gly Gly Gly Gly Phe He 
20 

Leu Asp Lys Gly Tyr Thr Val Arg 

35 40 



Ser Gly Gin Gly Gin Thr lie Cys 

10 15 

Ala Ser Trp Met Val Lys Leu Leu 

25 30 

Gly Thr Ala Arg Asn Pro Ala Asp 
4 5 
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P- Lys Asn Ser His Leu Arg Glu Leu Glu Gl y Ala Glu Qlu 
Thr Leu Cys Lys Ala Asp Leu Leu 



. n --- Arg Leu 

u 

" 60 



Asp Tyr Glu Ser Leu Lys Glu Gly 
75 

He Gin Gly Cys Asp Gly Val. Phe His Thr Ala Se* 



65 70 

80 



85 



Asp Pro Glu Glu 
100 



Pro Val Thr Asp 
95 



105 110 



Ser Iie Gly Ala Val Tyr Met: Asp Pro Asn Lys Gly Pro Asp Val Val 

• -5 



He Asp Glu 
145 



r Cys Tr P Ser Asp Leu Glu Phe Cys Lys Asn Thr Lys 

150 155 

■"•^ 160 



165 

Val Leu Gly Pro Leu Leu Gin Pro Thr Val Asn Ala Ser lie Thr His 

205 ' 

He Leu Lys Tyr Leu. Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ser Val 

• 220 



Phe Glu Thr Pro Ser Ala Ser Gly Arg Tyr Leu Cys Ser Qlu fi 

245 



er Val 

250 



255 
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Leu His Arg Gly Glu Val Val Glu He Leu Ala Lys Phe Phe Pro Glu 
260 265 270 

Tyr Pro He Pro Thr Lys Cys Ser Asp Glu Lys Asn Pro Arg Lys Gin 
275 280 285 

Pro Tyr Lys Phe Ser Asn Gin Lys Leu Arg Asp Leu Gly Phe Glu Phe 
290 . 295 300 

Thr Pro Val Lys Gin Cys Leu Tyr Glu Thr Val Lys Ser Leu Gin Glu 
305 310 315 320 

Lys Gly His Leu Pro lie Pro Lys Gin Ala Ala Glu Glu Ser Leu Lys 
325 330 335 

He Gin 



(2) INFORMATION POUR LA SEQ ID NO: 9: 

(i> CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 73 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 
■ (D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 66.. 1091 



(xi> DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9: 

TCGTAGCTCT TCCCTTTCAC CAACAAGCTA GTTTAGACAA GTACAGTGGT ACTGTAAGAG 6 0 

CAACA ATG ACC GTT GTC GAC GCC GCC GCG CCG CAG CTG CCT GGC CAT 107 
Met Thr Val Val Asp Ala Ala Ala Pro Gin Leu Pro Gly His 

1 .5 io 
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GGG «. ACC GTG TGC =TC «C CGC GCC SCO GCG TAC ATC GCG TCG GGG 
G1V Ol» Th t v.l CyS v.l Th , G ly „. „. 0Iy Tyr „. Ma ^ 

15 20 05 

30 

35 



40 45 



-CC ATA TOO CCC CCC GTC GAG. GGC TOC CAC GGC GTG TTC CAC ACC GCC 
A.a He Cys Ala Ala Val Glu Gly Cys His Gly Val Phe HlS Thr Ala 

80 



100 



105 



110 



ciy x hr Glu Tyr val Ile Asn Ala Ala Ma ftia t ^ v ^ ^ 



115 120 

12 5 



130 



145 150 



155 



TTC TGC AAG AAA ACC AAG AAC TGG TAC TGC TAP rrr * ^ 

ibL TAC GGC AAG GCC GTG GCG 

Phe Cys Lys Lys Thr Lys Asn Trp Tyr Cv. tw '^i r 

P iyr cys Tyr Gly Lys Ala Val Ala 

165 170 



155 



203 



!51 



50 

GCC ACC AAG AGG CTG ATC CTC TGC AAA GCC GAC CTC CTC GAC TAC GAC 

Ala Thr Lys Arg Leu lie Leu Cys Lys Ala Asp Leu' L eu Asp 

65 70 



347 



595 



44 3 



491 



539 



587 
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GAG CAG GCT GCG TGG GAG GCG GCC AGG AAG CGC GGC ATC GAC CTC GTC 635 

Glu Gin Ala Ala Trp Glu Ala Ala Arg Lys Arg Gly lie Asp Leu Val 
175 180 185 190 

GTC GTG AAC CCT GTG CTC GTG GTA GGG CCG CTG CTG CAA CCA ACG GTG 68 3 

Val Val Asn Pro Val Leu Val' Val Gly Pro Leu Leu Gin Pro Thr Val 
195 200 205 

AAC GCT AGC GCC GCA CAC ATC CTC AAG TAC CTC GAC GGC TCG GCC AAG 731 
Asn Ala Ser Ala Ala His He Leu Lys Tyr Leu Asp Gly Ser Ala Lys 
210 215 220 

AAG TAC GCC AAC GCT GTG CAG TCA TAC GTA GAC GTG CGT GAC GTA GCC 7 7 S 

Lys Tyr Ala Asn Ala Val Gin Ser Tyr Val Asp Val Arg Asp Val Ala 
225 230 235 

GGC GCG CAC ATC CGG GTG TTC GAG GCG CCT GAG GCG TCG GGC CGG TAC 82 7 

Gly Ala His He Arg Val Phe Glu Ala Pro Glu Ala Ser Gly Arg Tyr 
240 245 250 

CTC TGC GCC GAG CGC GTG CTG CAC CGT GGG GAC GTT GTC CAA ATC CTC 8 75 

Leu Cys Ala Glu Arg Val Leu His Arg Gly Asp Val Val Gin He Leu 
255 260 265 270 

AGC AAA- CTC TTG CCT GAG TAC CCT GTG CCA ACA AGG TGC TCT GAT GAA 92 3 

Ser Lys Leu Leu Pro Glu Tyr Pro Val Pro Thr Arg Cys Ser Asp Glu 
275 280 285 

GTG AAC CCA CGG AAG CAG CCT TAT AAG ATG TCC AAC CAG AAG CTG CAG 9 71 

Val Asn Pro Arg Lys Gin Pro Tyr Lys Met Ser Asn Gin Lys Leu Gin 
290 295 300 

GAT CTT GGC CTC CAG TTC ACT CCT GTG AAC GAC TCT CTG TAT GAG ACC 1019 
Asp Leu Gly Leu Gin Phe Thr Pro Val Asn Asp Ser Leu Tyr Glu Thr 
305 310 315 

GTG AAG AGC CTC CAG GAG AAG GGA CAT CTC CTA GTA CCA AGC AAA CCC 106 7 

Val Lys Ser Leu Gin Glu Lys Gly His Leu Leu Val Pro Ser Lys Pro 
320 325 330 
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GAG GGA TTA AAC GGT GTA ACC GCA TGATACTGCT AAAGAAGCAG CAGAGTTCAC 

Glu Gly Leu Asn Gly Val Thr Ala AGAGTTCAC 112l 

335 ' 340 

GTGCTCCTGT AACATGGTCA AACATGAGTT GTTTTTCTGT ATAAATTCTA TCCAGTATCG 1181 



TGTTATTTAA GTGAACTAAG AGAACAGAAT ATTGTATCAT CTTCGATGTC CAATACCTGG 
AAGTGATTTG TTTTGCCACC TAAAAAAAAA AA 



<2) INFORMATION POUR LA SEQ ID NO: 10: 

(i> CARACTERISTIQUES DE LA SEQUENCE : 
(A) LONGUEUR: 342 acides amines 
(Ei TYPE: acide amine 
(D) CONFIGURATION: lineaire 

<ii> TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 10: 

ro Gin Leu Pro Gly His Glv Gin 



Met Thr Val Val Asp Ala Ala Ala P 



1 

T-r v.l Cy. v.X Th. oly „. Ala » y ^ ^ ^ ^ ^ 

Lys Leu Leu. Leu Glu Arg Gly Tyr Thr v a 1 ■ r 

y y iyr Thr Val Lys Gly Thr Val Arg Asn 

. 35 40 45 

50 55 

Lys Arg Leu lie Leu Cvs Lvs ai. t 

Y YS Ala ASP Leu Leu Tyr Asp Ala II. 

cv= «. «. v,x olu oly Cy5 H1 . oly „ al ph> a ^ ^ 

85 



1241 



1273 
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Val Thr Asp Asp Pro Glu Gin Met Val Glu Pro Ala Val Arg Gly Thr 

100 105 HO 

Glu Tyr Val He Asn Ala Ala Ala Asp Ala Gly Thr Val Arg Arg Val 
115 120 125 

Val Phe Thr Ser Ser He Gly Ala He Thr Met Asp Pro Asn Arg Gly 
130 135 140 



Pro Asp Val Val 
145 

Lys Lys Thr Lys 

Ala Ala Trp Glu 
180 

Asn Pro Val Leu 
195 

Ser Ala Ala His 
210 

Ala Asn Ala Val 
225 

His He Arg Val 

Ala Glu Arg Val 
260 

Leu Leu Pro Glu 
275 

Pro Arg Lys Gin 
290 



Val Asn Glu Ser 
150 

Asn Trp Tyr Cys 
165 

Ala A.la Arg Lys 

Val Val Gly Pro 
200 

He Leu Lys Tyr 
215 

Gin Ser Tyr Val 
230 

Phe Glu Ala 
245 

Leu His Arg 

Tyr Pro Val 

Pro Tyr Lys 
295 



Cys Trp Ser Asp 
155 

Tyr Gly Lys Ala 
170 

Arg Gly lie Asp 
185 

Leu Leu Gin Pro 

Leu Asp Gly Ser 
220 

Asp Val Arg Asp 
235 

ro Glu Ala Ser Gly 
250 

Gly Asp Val Val Gin 
265 

Pro Thr Arg Cys Ser 
280 

Met Ser Asn Gin Lys 

300 



Leu Glu Phe Cys 
160 

Val Ala Glu Gin 
175 

Leu Val Val Val 
190 

Thr Val Asn Ala 
205 

Ala Lys Lys Tyr 

Val Ala Gly Ala 
240 

Arg Tyr Leu Cys 
255 

He Leu Ser Lys 
270 

Asp Glu Val Asn 
285 

Leu Gin Asp Leu 
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2 ,e U 01n Phe Thr VaJ l ^ t ^ ^ ^ 

3 2 S 

• • 330 335 

Leu Asn Gly Val Thr Ala 
340 



(2) INFORMATION POUR LA SEQ ID NO: 11 : 

ID CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1293 pa ires de bases 
(E) TYPE: acide nucleique 
!C) NOMBRE DE BRINS : simple 
(D) CONFIGURATION: lineaire 



(ii) TYp E DE MOLECULE:. ADNc pou 



pour ARNm 



(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 95.. 1108 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 11: 
CCCAGCCTAT TTCTTCCCTA TATCCACTCA TCCTTGTCTT ATATCATCAT CATCATCATC 

TACCTAAACC TGAGCTCAAC AGAAAAGTAA TACC ATG CCG TCA GTT TCC GGC 

Met Pro Ser Val Ser Gly 



6 0 



112 



2 - GTT TGT GTT ACT GGC. GCC GGA GGT TTC ATC GCC TCT TOG CTC 
GTT AAA ATT CTT CTG GAA AAA GGC TAC ACT GTT ar-n 

v . n T T1 CT GTT AGA ACA GTA CGA 2 08 

Val Lys He Leu Leu Glu Lys Gly Tvr Thr " 2 ° 8 

y iyr Thr Val Arg Gly Thr Val Arg 
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AAT CCA GAT GAT CGA AAA AAT AGT CAT TTG AGG GAG CTT GAA CGA GCA 2 56 

Asn Pro Asp Asp Arg Lys Asn Ser His Leu Arg Glu Leu Glu Arg Ala 

40 45 50 



304 



AAA GAG ACA TTG ACT CTG TGC AGA GCT GAT CTT CTT GAT TTT CAG AGT 
Lys Glu Thr Leu Thr Leu Cys Arg Ala Asp Leu Leu Asp Phe Gin Ser 
55 60 65 70 

TTG CGA GAA GCA ATC AGC GGC TGT GAC GGA GTT TTC CAC ACA CGT TCT 352 
Leu Arg Glu Ala He Ser Gly Cys Asp Gly Val Phe His Thr Arg Ser 
75 * 80 85 

CCT GTC ACT GAT GAT CCA GAA CAA ATG GTG GAG CCA GCA GTT ATT GGT 4 00 

Pre Val Thr Asp Asp Pro Glu Gin Met Val Glu Pro Ala Val He Gly 
50 95 100 

ACA AAG AAT GTG ATA ACG GCA GCA GCA GAG GCC AAG GTG CGA CGT GTG 44 8 

Thr Lys Asn Val He Thr Ala Ala Ala Glu Ala Lys Val Arg Arg Val 
105 no us 

GTG TTC ACT TCG TCA ATT GGT GCT GTG TAT ATG GAC CCA AAC AGG GAC 4 96 

Val Phe Thr Ser Ser He Gly Ala Val Tyr Met Asp Pro Asn Arg Asp 
12 ° " 125 130 

CCT GAT AAG GTT GTC GAC GAG ACT TGT TGG AGT GAT CCT GAC TTC TGC 54 4 

Pro Asp Lys Val Val Asp Glu Thr Cys Trp Ser Asp Pro Asp Phe Cys 
135 140 145 15Q 

AAA AAC ACC AAG AAT TGG TAT TGT TAT GGG AAG ATG GTG GCA GAA CAA 5 92 

Lys Asn Thr Lys Asn Trp Tyr Cys Tyr Gly Lys Met Val Ala Glu Gin 
155 160" 165 

GCA GCA TGG GAC GAA GCA AGG GAG AAA GGA GTC GAT TTG GTG. GCA ATC 64 0 

Ala Ala Trp Asp Glu Ala Arg Glu Lys Gly Val Asp Leu Val Ala He 
170 175 i8o 

AAC CCA GTG TTG GTG CTT GGA CCA CTG CTC CAA CAG AAT GTG AAT GCC 6 88 

Asn Pro Val Leu Val Leu Gly Pro Leu Leu Gin Gin Asn Val Asn Ala 
185" 190 195 
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ACT GTT CTT CAC ATC CAC AAG TAC CTA ACT GGC TCT GCT AAA ACA TAT 
Ser Val Leu His Il e HiS Lys T yr Leu Thr Gl 



200 ' _ 205 



y Ser Ala Lys Thr Tyr 

. 210 



AAG CCA AGG GTA AAA CCG TAC AAA TTC TCA AAC CAA AAG CTA AAG GAT 
Lys Pro Arg Val Lys Pro Tyr Lys Phe Ser Asn Gin 



280 28S 



Lys Leu Lys Asp 



Leu Gly Leu Glu Phe Thr Pro Val Gin Cys Leu Tyr Glu Thr Val Lys 

J05 310 

AGT CTA CAA GAG AAA GGT CAC CTT CCA ATT CCT ACT CAA AAG GAT GAG 
Ser Leu Gin Glu Lys Gly „ ia Leu Pro Ile prQ Thr ^ ^ ^ ^ 

315 320 325 

ATT ATT CGA ATT CAG TCT GAG AAA TTC AGA AGC TCT TAG C ATGTAT 
lie lie Arg lie Gin Ser Glu Lys Phe Arg s 



er Ser 



330 335 



736 



784 



832 



Thr Ser Asn Ser Leu Gin Ala Tyr Val Hls Val Arg Asp Val Ala Leu 

* il5 220 90Q 

230 

235 ' 240 

Cys Ala Glu Ser Val Leu His Arg Cys Asp Val Val Glu lie Leu Ala 

AAA TTC TTC CCG GAG TAT CCT ATC CCC ACC AAG TGT TCA GAT GTG ACG 

■ S ^ Pr ° G1U T ^ Pr ° "e Pro Thr Lys Cys Ser Asp Val Thr 

2 6 5 2 70 

^/U 275 



880 



976 



1024 



1072 



1116 



TGAGGAAAAG GGATCAATGG TTAAAGTTGA CCATGGCGTT GTCCCTTTAT GTACCAAGAC 1178 
CAAATGCACC TAGAAATTTA CTTGTCTACT CTGTTGTACT TTTACTTGTC ATGGAAATGT 123 e. 
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TTTTAGTGTT TTCATTGTTA TGAGATATAT TTTGGTGTAA AAAAAAAAAA AAAAA 



(2) INFORMATION POUR LA SEQ ID NO: 12: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 3 38 acides amines 
{B> TYPE: acicie amine 
(Di CONFIGURATION: lineaire 

{H5 TYPE DE MOLECULE: proteine 

DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Pre Ser Vai Ser Gly Gin He Val Cys Val Thr Gly Ala Glv Giv 
1 5 io 15 

Phe He Ala Ser Trp Leu Val Lys He Leu Leu Glu Lys Gly Tyr Thr 
20 25 30 

Val Arg Gly Thr Val Arg Asn Pro Asp Asp Arg Lys Asn Ser His Leu 
35 40 45 

Arg Glu Leu Glu Arg Ala Lys Glu Thr Leu Thr Leu Cys Arg Ala Asp 
50 55 60 

Leu Leu Asp Phe Gin Ser Leu Arg Glu Ala He Ser Gly Cys Asp Gly 
65 70 75 eo 

Val Phe His Thr Arg Ser Pro Val Thr Asp Asp Pro Glu Gin Met Val 
85 90 95 

Glu Pro Ala Val He Gly Thr Lys Asn Val He Thr Ala Ala Ala Glu 
100 105 i 10 



Ala Lys Val Arg Arg Val Val Phe Thr Ser Ser He Gly Ala Val Tyr 



1293 



H5 120 



125 
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Ser Asp Pro Asp P he .Cys Lys Asn Thr Lys Asn Trp ^ ^ ^ 

14 ^ - ISO 

155 

X " 160 
• S ^ ^ -P Asp Glu Ala Ar g Glu Lvs Gly 

Val Asp Leu Val Ala He Asn Pro Val Leu Val Leu Gly Pro Leu Leu 
180 



Gin cm Asn Val Asn Ala Ser Val Leu H is lie His Lys Leu Thr 

195 

>05 



200 



• 210 

235 

ZSb 240 
Ala ser Gly Arg Tyr Leu Cys Ala Qlu ^ ^ ^ ^ ^ 
245 

Val val Glu He Leu Ala Lys Phe Phe Pro Glu Tyr pro ^ ^ ^ 

260 265 
Lys Cys Ser Asp Val Thr Lys Pro Arg Val Lys p ro Tyr ^ Ph 
275 



e Ser 



Asn Gin Lys Leu Lys Asp Leu Gly Leu Glu Phe Thr Pro Val Gin Cys 

300 

305 ' 310 31 , 

J15 320 

Pro Thr Gin Lys Asp Glu lie He Arq n~ rin ^ T 

9 ile GIn s er Glu Lys Phe Arg 

325 330 

JJU 335 

Ser Ser 



BNSOOCID: <WO 9712982A1_L> 



WO 97/1 2982 PCT/FR96/01 544 

- 61 - 

(2) INFORMATION POUR LA SEQ ID NO: 13: 

(i) CARACTER I STI QUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 9 7 pa ires de bases 
(E) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADNc pour ARNm 

<ix) . CARACTER I STIQUE ADDITIONELLE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT: 136.. 1140 

•xi} DESCRIPTION DE LA SEQUENCE : . SEQ ID NO: 13: 



CGGCCGGGAC GACCCGTTCC TCTTCTTCCG GGTCACCGTC ACCATGTTAC ACAACATCTC 6 0 

CGGCTAAAAA AAAAAGGAAA AAAAGCGCAA CCTCCACCTC CTGAACCCCT CTCCCCCCTC 120 

GCCGGCAATC CCACC ATG CCC GTC GAC GCC CTC CCC GGT TCC GGC CAG ACC 171 
Met Pro Val Asp Ala Leu Pro Gly Ser Gly Gin Thr 
15 10 

GTC TGC GTC ACC GGC GCC GGC GGG TTC ATC GCC TCC TGG ATT GTC AAG 219 
Val cys Val Thr Gly Ala Gly Gly Phe lie Ala Ser Trp He Val Lys 
15 20 25 

CTT CTC CTC GAG CGA GGC TAC ACC GTG CGA GGA ACC GTC AGG AAC CCA 26 7 

Leu Leu Leu Glu Arg Gly Tyr Thr Val Arg- Gly Thr Val Arg Asn Pro 
30 35 40 



GAC GAC CCG AAG AAT GGT CAT CTG AGA GAT CTG GAA GGA GCC AGC GAG 315 
Asp Asp Pro Lys Asn Gly His Leu Arg Asp Leu Glu Gly Ala Ser Glu 
45 50 55 



60 



AGG CTG ACG CTG TAC AAG GGT GAT CTG ATG GAC GAC GGG AGC TTG GAA 36 3 

Arg Leu Thr Leu Tyr Lys Gly Asp Leu Met Asp Asp Gly Ser Leu Glu 

65 70 75 
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ACC TCC TCC ATC GGT GCA GTC ACC ATG GAC CCC AAC CGC 



n , 5G OCA GAC GTT 

^ " 116 Val Th * Asp Pro Asn , rg Ala Asp val 



. "0 

I-u Val Le u Gly P ro W Leu Gin Ser Thr He Asn Ala Ser xle He 
225 



411 
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gaa ccc „c »g gcg tgc gac ggc gtc g^c cac acc gcc tct ceo ore 

ACC »c CAT CCT GAG CAA ATG CTC OS G CCA GCG ' GTG A « GGG ,CG M 
X hl ,AS P Asp Pro olu G1 „ M1 „ u Ma ^ . « *» 

9 5 '■ ■ 

100 105 

Asn V.X XU V.X Ala Glu „. ^ Ar , At9 V>1 p „. 

110 115 ' ~ 

XD 120 



55r 



• 13 ° 

Val val Asp Glu Ser CyS Trp Ser Asp Leu Qlu phg ^ ^ ^ ^ 
145 

160 



699 



747 



79; 



843 
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GGC CGC TAT TTG TGC GCC GAG AGC 
Gly Arg Tyr Leu Cys Ala Glu Ser 
245 250 



GTC CTC CAC CGT GGC GAT GTG GTG GAA ATC CTT GCC AAG TTC TTC CCT 939 
Val Leu His Arg Gly Asp Val Val Glu lie Leu Ala Lys Phe Phe Pro 
255 260 265 

GAG TAT AAT GTA CCG ACC AAG TGC TCT GAT GAG GTG AAC CCA AGA GTA 98 7 

Glu Tyr Asn Val Pro Thr Lys Cys Ser Asp Glu Val Asn Pro Arg Val 
270 275 280 

AAA CCA TAC AAG TTC TCC AAC CAG AAG CTG AGA GAC TTG GGG CTC GAG 1C3 5 

Lys Pro Tyr Lys Phe Ser Asn Gin Lys Leu Arg Asp Leu Gly Leu Giu 
285 29C 295 300 

TTC ACC CCG GTG AAG CAG TGC CTG TAC GAA ACT GTC AAG AGC TTG CAG 10 8 3 

Phe Thr Pro Val Lys Gin Cys Leu Tyr Glu Thr Val Lys Ser Leu Gin 
305 310 315 

GAG AAA GGC CAC CTA CCA GTC CCC TCC CCG CCG GAA GAT TCG GTG CGT 1131 
Giu Lys Gly His Leu Pro Val Pro Ser Pro Pro Glu Asp Ser Val Arg 
320 325 330 

ATT CAG GGA TG AT CTT AG A TCCATCACGG TGCGCATTTG TAATCCGGAG 11 SO 

He Gin Gly 
' 335 

AAATGAGAGA AACATGTGGG AATTTGTTTG TACTTTTCTA AGTCAAACCT G GAG AT ACC A 124 0 

ACCCTGAGTT CTGCATTGGA ATGGAAGTTG TCAATTGTTC CAAAAAAAAA AAAAAAA 12 9 7 



(2) INFORMATION POUR LA SEQ ID NO: 14: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 5 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE : proteine 

(X1 ' DESC ^PTION DE LA SEQUENCE : SEQ ID NO : 14 [ 

V " Ma ^ Gly Ser Gly Gln ^ ^ 

oiy ai. Gly Gly Phe Ile ^ s. rTrp Ile val Lys Leu Leu " 

35 40 45 

Asn Gly „ is Leu Arg Asp ^ Ma l ^ ^ ^ 

50 55 

60 

Tyr Lys Cl y Asp Leu Met Asp Asp Qly ^ 

75 

80 



85 

Glu Gin Met Val Glu Pi 



85 90 

yU 95 



5 ro Ala Val lie \r Thv i 

xxe o±y Thr Lys Asn Val He Val 

130 . 135 

140 

Ser Cys Trp Ser Asp Leu Glu Phe Cys Lys Ser Thr r 

, y ys ber Thr Lys Asn Trp Tyr 

=y x yr oly Lys » a val u . „„ Lye Ala ^ ^ o 
180 
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Pro Leu Leu Gin Ser Thr He Asn Ala Ser He He His He Leu Lys 

195 200 205 

Tyr Leu Thr Gly Ser Ala Lys Thr Tyr Ala Asn Ser Val Gin Ala Tyr 
210 215 220 



Val His Val Lys 
2 2 5 

Pro Ser Ala Ser 

Gly Asp Val Val 
260 

Pro Thr Lys Cys 
275 

Phe Ser Asn Gin 
290 

Lys Gin Cys Leu 
305 

Leu Pro Val Pro 



Asp Val Ala Leu 
230 

Gly Arg Tyr Leu 

245 

Glu He Leu Ala 

Ser Asp Glu Val 
280 

Lys Leu Arg Asp 
295 

Tyr Glu Thr Val 
310 

Ser Pro Pro Glu 
325 



Ala His Val Leu 
235 

Cys Ala Glu Ser 
250 

Lys Phe Phe Pro 
265 

Asn Pro Arg Val 

Leu Gly Leu Glu 
300 

Lys Ser Leu Gin 
315 

Asp Ser Val Arg 
330 



Val Leu Glu Thr 
240 

Val Leu His Arg 

255 

Glu Tyr Asn Val 
270 

Lys Pro Tyr Lys 
285 

Phe Thr Pro Val 

Glu Lys Gly His 
320 

He Gin Gly 
335 
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RE VINDICATIONS 

1. Utilisation de sequences nucleo.idiques recomb.nantes contenant une 
(ou plus.eurs) reglon(s) codante(s) , ce(te (ces) ™ - 

consume*, dune sequence nucleotidique chois.e parmi les suivantes 

Ja sequence nucleotidique representee par SEQ ID NO 1 . codant pour 

: n c A R ; ARNm ««™ pour , cinnamoy. CoA reduct 

(CCR) de luzerne representee par SEQ ID NO 2. 

-la sequence nucleotidique represen.ee par SEQ ID NO 3, codan, pour 
SEQ No" COdan ' ' U " m<me P ° Ur " CCR dC ™" «P*»C 

SEO .n mo /TT" ^ " " qUe " Ce nUCli « id ">- represen.ee par 
SEQ ID NO ou de celle represen.ee par SEQ ,D NO 3. ce fragmen, codan, 
pour u„ fragmen, de ,a CCR represen.ee par SEQ ID NO 2 ou pour un 
ragmen, de ,a CCR represen.ee par SEQ ,D NO 3. respecvemen, ce 
ragrnen. de CCR presen.an, m ac,,vi,e _ ique i • 

ueux CCR susmentionnees, 

SEO m'™ r nC l nUCl<0 ' id ' qUe C ° m P'=™ re celle represen.ee par 
SEQ ID NO 1 ou SEQ ID NO 3. ceue sequence complement codan. pour 
un ARNm anusens susceptible de s'hybrider avec I'ARNm code par . les 
sequences SEQ ID NO 1 e, SEQ ID NO 3, respec.ivemen.. 

- un fragmen. de la sequence nucleo.idique complememaire de celle 
represen.ee par SEQ ID NO . ou SEQ ID NO 3. ce fragmen. de sequence 
odan, pour un ARNm anUsens suscep.ible de s'bvbrider avec I'ARNm codan, 
lu,-meme pour la CCR represen.ee par SEQ ID NO 2. ou avec I'ARNm 
codan. lu.-meme pour la CCR representee par SEQ ID NO 4. respecvemen, 

SEO m InT^Z nUC ' 60l ' di<,Ue <* ^"ence representee par 

SEQ ID NO 1 ou SEQ ID NO 3 ; notammen, par mutation et/ou addi.ion e,/ou 
suppress.on, e,/ou s u bs,i,u„on d'un ou P ,us,eurs nuclides, cene sequence 

TeoT Zn': P ° Ur ™ ARNm COdaW IU " m6me >™ " C ™ »,ee 
un or!, h- ° U Q 10 N ° 4 « ^ur un fragment ou 

une proteme denvee de ces dernieres. ce fragmen. ou pro.eine derivee 
presentant une acivi.e enzvma.ique equ.valen.e a celle desdi.es CCR chez les 

- la sequence nucleotidique derivee de la «£n.,- n ,. A .- 

H rc ae la sequence nucleotidique 

compementaire susmentionnee. ou du fragmen, de cette sequence 
co mp ,emen,a,re ,el que decrit ci-dessus. par mutation e,/ou addition et/ou 
su PP res s ,on, e,/ou subst.tution d'un ou piusieurs nucleotides, cette sequence 
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10 



15 



20 



25 



30 



derivee codant pour un ARNm antisens susceptible de s'hybrider avec un des 
ARNm susmentionnes, 

pour la transformation de cellules vegetales en vue de Tobtention de plantes 



dans le sens d'une augmentation, soit dans le sens d'une diminution des 
teneurs en lignines produites, par rapport aux teneurs normales en lignines 



2. Sequence d'ADN, caracterisee en ce qu'elle comprend a titre de 
region codante: 

- la sequence nucleotidique representee par SEQ ID NO 1, codant pour 
un ARNm, cet ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 2, ou 

- un fragment de la sequence nucleotidique susmentionnee, ce fragment 
codant pour un fragment de la CCR representee par SEQ ID NO 2, ce 
fragment de CCR presentant une activite enzymatique equivalente a celle de la 
CCR susmentionnee, ou 

- toute sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 1 susmentionnee, ou d'un fragment tel que decrit ci-dessus de 
cette sequence, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm codant lui-meme pour la CCR representee par SEQ ID NO 2; 
ou pour une proteine derivee de cette derniere et presentant une activite 
enzymatique equivalente a celle de ladite CCR chez les plantes. 

3. Sequence d'ADN, caracterisee en ce qu'elle comprend a titre de 
region codante: 

- la sequence nucleotidique representee par SEQ ID NO 3, codant pour 
ARNm, cet ARNm codant lui-meme pour la CCR representee par 
SEQ ID NO 4, ou 

- un fragment de la sequence nucleotidique susmentionnee, ce fragment 
codant pour un fragment de la CCR representee par SEQ ID NO 4, ce 
fragment de CCR presentant une activite enzymatique equivalente a celle de la 
CCR susmentionnee, ou 

- toute sequence nucleotidique derivee de la sequence representee par 
SEQ ID NO 3, susmentionnee, ou d'un fragment tel que decrit ci-dessus de 
cette sequence, notamment par mutation et/ou addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm codant lui-meme pour la CCR representee par SEQ ID NO 4, 



transgeniques au sein desquelles la biosynthese des lignines est regulee soit 



produites chez les plantes. 
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ou pour une proteine denvee de cette derniere et presentant une activite 
enzymauque equivalent a cel.e de ladite CCR chez les plantes. 

4. Sequence d'ADN. caracterisee en ce ou'elle comprend a titre de 

region codante: tre de 

' D N ° '• Ce,K se " uence "mplemeraaire codan, pour un ARNm an.isel 
"T* ^ S hybrid " "« ' ARN ™ codan, lui-meme pour la CCR 
represen.ee par SEQ ,D NO 2. a savoir I'ARNm code pa ,a sequel 
represen.ee par SEQ ,D NO ,,. „u code par une sequence derivee de cer e 
dermere, telle que definie dans la revendicalion 2, ou 

- u„ fragmen. de la sequence complement susmenuonnee ce 

27",' T" C0<,am P ° Ur U " ARNm " —P««*" de 

SEO D NoT C ° daM ' Ui ' mime P ° Ur " CCR re Pr«e„,ee P. 

SEQ ID NO 2, lei que defini ci-dessus. ou 

- .ou.e sequence nucleo.idique derivee de la sequence complement 
susmenuonnee. ou du fragmen, de ce..e sequence co„, pl ememaire .e, que 
deer,, c,-dessus. noammen, par mma.ion «/ou addhion. e./ OU suppression 
«/«, subsunnion d un ou plusieurs nuclides. ce,.e sequence denvee codam 
pour un ARNm antisens susceptible de s'nybrider av.ee I'ARNm susmemionne. 

5. Sequence d'ADN. carac.ensee en ce quelle comprend a ,i,re de 

region codante: 

SFO m'Lf r nCC nUC,6 ° tldiqUe 'omp.6mentaire de cel.e representee par 
ID K N ° 3 ' CeUe S " qUence c ™plementaire codant pour un ARNm antisens 
susceptible de s'hybrider avec I'ARNm codant lui-meme pour la CCR 
representee par SEQ ID NO 4, a savoir I'ARNm code par ,a sequence 
representee par SEQ ID NO 3, ou code par une sequence derivee de cette 
derniere, telle que definie dans la revendicalion 3, ou 

- un fragment de la sequence complements susmenuonnee ce 
fragment de sequence codant pour un ARNm antisens susceptible de 

seo m NoT , rARNm C ° dam ,U ™ me p ° ur 13 CCR re P" p- 

SEQ ID NO 4, tel que defini ci-dessus, ou 

- toute sequence nucleotide derivee de la sequence complememaire 
susmenuonnee, ou du fragment de cette sequence complement te, que 
decnt ci-dessus. notamment par mutation et/ou addition, et/ou suppression, 
et/ou substation d'un ou plusieurs nucleotides, cette sequence derivee codant 
pour un ARNm antisens susceptible de s'hybrider avec I'ARNm susment.onne 
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15 



20 
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30 



6. ARNm code par une sequence d'ADN selon Tune des revendications 
2 a 5, et plus particulierement: 

- I'ARNm code par la sequence d'ADN representee par SEQ ID NO 1, 
ou code par un fragment ou une sequence derivee tels que definis dans la 
revendication 2, ledit ARNm etant susceptible de coder a son tour pour la 
CCR presente chez la luzerne, telle que representee par SEQ ID NO 2, ou 
pour un fragment de cette CCR ou une proteine derivee tels que definis dans la 
revendication 2, 

- I'ARNm code par la sequence d'ADN representee par SEQ ID NO 3, 
ou code par un fragment ou une sequence derivee tels que definis dans la 
revendication 3. ledit ARNm etant susceptible de coder a son tour pour la 
CCR presente chez le mais, telle que representee par SEQ ID NO 4, ou pour 
un fragment de cette CCR ou une proteine derivee tels que definis dans la 
revendication 3. 

7. ARNm antisens. caracterise en ce qu'il comprend des nucleotides 
complementaires de la totalite ou d'une partie seulement des nucleotides 
constituant un ARNm selon la revendication 6, et en ce qu'il est susceptible de 
shybrider avec ce dernier. 

8. CCR telle que presente dans les cellules de luzerne ou de mais, et. 
representee par SEQ ID NO 2 ou SEQ ID NO 4 respectivement, ou toute 
proteine derivee de ces dernieres, notamment par addition, et/ou suppression, 
et/ou substitution d'un ou plusieurs acides amines, ou tout fragment issu 
desdites CCR ou de leurs sequences derivees, lesdits fragments et sequences 
derivees etant susceptible de posseder une activite enzymatique equivalente a 
celle des CCR susmentionnees. 

9. Sequences nucleotidiques codant pour les CCR representees par 
SEQ ID NO 2 ou SEQ ID NO 4, ou toute sequence derivee ou fragment de 
ces dernieres, selon la revendication 8, lesdites sequences nucleotidiques etant 
caracterisees en ce qu'elles correspondent a tout ou partie des sequences 
representees par SEQ ID NO 1 ou SEQ ID NO 3 respectivement, ou a toute 
sequence derivee de ces dernieres par degenerescence du code genetique, et 
etant neanmoins susceptibles de coder pour une CCR ou sequence derivee ou 
fragment de cette derniere, tels que definis dans la revendication 8. 

10. Complexes formes entre un ARNm antisens selon la revendication 7, 
et un ARNm selon la revendication 6. 
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11. Sequence „ucieo,idique recombinant carac.erisee en ce au'elle 
contend au moins u„e sequence d'ADN selon Tune des revend.ca.ions 2 e, 

n/cCR'c' C T T """" ""^ * ^ 

une CCR chez ,es p,a„,e, ,adi,e sequence se.on lune des revendica.ions 2 « 3 

etant inseree dans une sequence heterologue. 

12 Sequence nucleotidique recombinante, caracter.see en ce qu'el.e 
comprend au m01 ns une sequence d'ADN complement^ selon Tune des 
revocations 4 et 5, mseree dans une sequence hetero.ogue, .ad.te sequence 
d ADN complements codant pour un ARNm ant.sens susceptible de 
s hybnder avec l'ARNm codant pour une CCR chez les plantes. 

13. Sequence nucleotide recombinante selon la revendicat.on 1 1 ou la 
revend.cat.on 12, caracterise en ce qu'e.le comprend les elements necessaires 
pour re g u,er repression de la sequence nucleotide selon Tune des 
revend.cat.ons 2 et 3, ou de sa sequence complements selon lune des 
revend.cat.ons 4 et 5, notamment un promoteur et un term.nateur de la 
transection de ces sequences, et le cas echeant, au moms une sequence 
d ADN codant pour tout ou partie d'une autre enzyme que la CCR qui se 
trouve etre impliquee dans une etape de biosynthese des lienines chez les 
Plantes, notamment l'ARNm codant lui-meme pour I'alcool cinnamy.ique 
des ydro g enase (CAD), ou au moms une sequence codant pour tout ou part, 
de I ARNm ant.sens suscept.ble de s hybrider avec l'ARNm susment.onne 
notamment avec l'ARNm codant pour la CAD. 

14 Vecteur recombinant caracterise en ce qu'i. comprend une sequence 
nucleoud.que recombinante selon l une des revendicat.ons 1 1 a 13 mteeree 
dans !un de ses s.tes de son genome non essentia pour sa replication. 

15. Procede de regulation de la biosynthese de lignines chez les plantes 
sou par diminution, soit par augmentation des teneurs en li gn i nes produces' 
par rapport aux teneurs norma.es en lig „ in es produites chez des plantes, led.i 
precede comprenant une etape de transformation de cellules de ces plantes a 
1 aide d un vecteur selon la revendication 14. 
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16. Procede de diminution de la biosynthese de lignine chez les plantes, 
et done de diminution des teneurs en lignines produites par rapport aux teneurs 
normales en lignines produites chez les plantes, caracterise en ce qu'il est 
effectue par transformation du genome de ces plantes, en y incorporant: 

- au moins une sequence d'ADN selon Tune des revendications 4 et 5, 

- et, le cas echeant, au moins une sequence d'ADN codant pour tout ou 
partie d un ARNm antisens capable de s'hybrider a un ARNm codant pour une 
autre enzyme que la CCR, qui se trouve etre impliquee dans une etape de la 
biosynthese des lignines chez les plantes, notamment I'ARNm codant pour la 
CAD, 

ladite transformation etant realisee: 

- soit a l'aide d'un vecteur recombinant selon la revendication 14, 
contenant une sequence nucleotidique recombinante selon la revendication 12 
ou la revendication 13, 

- soit a l'aide de plusieurs vecteurs recombinants dont Tun au moins 
conttent une sequence nucleotidique recombinante selon la revendication 12, 
tandis que V (ou les) autre(s) vecteur(s) recombinant(s) contien(nen)t une 
sequence d'ADN codant pour un ARNm antisens capable de s'hybrider a un 
ARNm codant pour une autre enzyme que la CCR, telle que definie ci-dessus. 

17. Procede de diminution de la biosynthese de lignine chez les plantes, 
et done de diminution des teneurs en lignines produites par rapport aux teneurs 
normales en lignines produites chez les plantes, caracterise en ce qu'il est 
effectue par transformation du genome de ces plantes, en y incorporant: 

- au moins une sequence d'ADN selon la revendication 2 et 3, 

- et, le cas echeant, au moins une sequence d'ADN codant pour tout ou 
partie d'une autre enzyme que la CCR, qui se trouve etre impliquee dans une 
etape de la biosynthese des lignines chez les plantes, notamment une sequence 
d'ADN codant pour tout ou partie de la CAD, 

ladite transformation etant realisee: 

- soit a l'aide d'un vecteur recombinant selon la revendication 14, 
contenant la sequence nucleotidique recombinante selon la revendication 1 1 ou 
la revendication 13, 

- soit a l'aide de plusieurs vecteurs recombinants dont Tun au moins 
contient une sequence nucleotidique recombinante selon la revendication 11, 
tandis que V (ou les) autre(s) vecteur(s) recombinant^ ) contien(nen)t une 
sequence d'ADN codant pour tout ou partie d'une enzyme autre que la CCR, 
telle que definie ci-dessus. 
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18. Precede d 'augmentation de la biosynthese de l.gnine chez Ies 
Plantes. et done d' augmentation des teneurs en lignmes produites par rapport 
aux renews normales en lignines produites chez .es plantes, caracterise 
qu .1 est effectue par transformation du genome de ces plantes en v 

incorporant: y 

- au moins une sequence d'ADN selon Tune des revendications 2 et 3 

- et, le cas echeant, au moins une sequence d'ADN codant pour une 
autre enzyme que .a CCR. qui se trouve etre imp.iquee dans une etape de la 
b.osynthese des lignines chez les p.antes. notamment une sequence d'ADN 
codant pour la CAD, 

ladite transformation etant realisee: 

- soil a 1'aide d'un vecteur recombinant selon la revendication 14 
untenant la sequence nucleotid.que recombinante selon la revendication 1 1 ou 
la revendication 13, 

- soh a 1'aide de plusieurs vecteurs recombmants dont Tun au moins 
conuen, une sequence nucleotidique recombinante selon la revend 1C ation 1 1 
tand,s que 1' (ou les) autre(s) ve Ct eur(s) recombinant(s) contien(nen)t une 
sequence d'ADN codant pour tout ou partie d'une enzyme autre que la CCR 
telle que definie ci-dessus. ' 

19. Plantes ou fragments de plantes, notamment cellules fruits 
semences, pollen, transform^ par incorporation dans leur eenome d'au moms 
une sequence nucleotidique selon l'une des revendications 2 a 5. 

20. Polypeptides recombinants, notamment CCR recombinantes 
representees par SEQ ID NO 2 ou SEQ ID NO 4. tels qu'obtenus par 
transforms de cellules vegetales en integrant de facon stable dans leur 
genome, une sequence nucleotidique recombinante selon l'une des 
revendications 1 1 a 13, notamment a 1'aide d'un vecteur selon la revendicatton 
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